开源本地听写应用
各维度得分依据公开资料与字段推算,加权后即综合评分,仅供参考。
bluemacaw 是一款开源跨平台语音转文字听写应用,定位很清晰:按住快捷键说话,松开后把转写文本粘贴到当前光标所在应用。它支持 macOS、Windows、Linux,采用 BYOK 模式,用户自带第三方语音识别 API Key,项目本身不提供后端服务。
它本身不训练或托管 STT 模型,而是预置接入 10 家服务商:OpenAI、Groq、Grok xAI、Deepgram、AssemblyAI、ElevenLabs、Fal、Gladia、Azure OpenAI、Rev.ai。文档示例提到 gpt-4o-mini-transcribe、whisper-large-v3、nova-3 等模型。优势是可按成本、速度、识别质量自由切换;局限是体验高度依赖所选 Provider。
bluemacaw 应用免费、开源、无需账号,没有升级层级和使用上限。真正的成本来自第三方 STT 服务商。正文称各 Provider 有免费或低成本层,足够试用,但未给出具体额度。应用仪表盘可查看不同 Provider 和模型的预估成本,这对长期听写用户有实际价值。
隐私设计是主要亮点:无遥测、无分析、无错误上报;音频只发送给用户选择的 Provider;API Key 存在系统凭据库,如 macOS Keychain、Windows Credential Manager、Linux Secret Service;转写文本本地 SQLite 保存,默认 1 年滚动保留且可调整。集成方式偏桌面级:全局热键录音,自动粘贴到当前应用。macOS 需麦克风和辅助功能权限;Linux Wayland 因安全限制不能直接模拟粘贴,需要手动 Ctrl+V。
优点是开源透明、无自有后端、跨平台、Provider 选择丰富、成本可控。缺点是必须自行申请 API Key,非技术用户上手门槛较高;Windows 当前构建未签名,可能触发 SmartScreen;Windows/Linux 标注 Beta,Linux 还存在 Wayland 粘贴限制。它适合开发者、写作者、重视隐私的知识工作者,以及希望把语音输入接入任意桌面应用的人。
正文未提供中国大陆网络、支付或可用性信息,因此访问状态判定为未知。实际可用性还取决于所选 STT Provider 在中国大陆的网络连通性与支付支持。若第三方 API 不稳定,可考虑本地 Whisper 客户端、MacWhisper、Superwhisper 或各语音识别服务商的官方工具作为替代。
本测评基于公开资料整理,不构成购买建议,请以 bluemacaw.org 官网实际信息为准。
自带密钥、无后端,适合隐私型STT。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。