浏览器内语音转文字
各维度得分依据公开资料与字段推算,加权后即综合评分,仅供参考。
Whisper Web 是一个免费的在线语音识别工具,主打“无需注册、隐私优先、永久免费”。它基于 OpenAI Whisper 模型,将录音、音频文件或在线链接转换为文本,并强调所有处理都在用户浏览器本地完成,音频不会上传到服务器。
从能力看,Whisper Web 支持麦克风录音、文件上传和 URL 输入,兼容 MP3、WAV、M4A、OGG、WEBM、FLAC 等常见格式。输出模式包括保留原语言转写,以及翻译为英文。它支持 80+ 语言,页面明确提到包含中文,并提供自动语言检测和手动选择。结果可导出为纯文本、JSON、SRT、VTT,适合后续整理、字幕制作和数据处理。
技术上,页面披露其框架包括 Next.js、Transformers.js、Hugging Face、WebGPU / WebAssembly,模型为 OpenAI Whisper。这意味着它更像“浏览器端本地 AI 工具”,而不是传统云端转写服务。隐私方面是最大卖点:官方称不收集、存储或处理音频文件,仅收集页面浏览、会话等标准分析数据,也不出售第三方数据。
定价信息非常直接:Free Forever、No Registration,未看到订阅、额度或付费功能说明。操作流程也比较清晰:选择输入方式、配置转写/翻译和模型等设置、开始处理、导出结果。对非技术用户较友好。不过页面截图显示 GPU Acceleration 当前不可用,实际处理速度可能主要取决于 CPU、浏览器和本机硬件。
优点是免费、免账号、本地处理、隐私保护强,且输出格式覆盖字幕和结构化数据,适合专业场景。局限在于页面未披露音频时长、文件大小、移动端表现、多人说话人分离等细节;也没有看到 API、团队协作或批量处理能力。对于长音频或低性能设备,体验可能不如云端服务稳定。
它适合记者、研究人员、法律从业者、学生、内容创作者,以及任何不希望上传敏感录音的用户。中国大陆访问情况无法从正文判断;由于托管、模型资源可能涉及 Vercel 和 Hugging Face,实际可用性可能受网络环境影响。国内替代可考虑讯飞听见、通义听悟;本地化替代可考虑 Whisper.cpp 或本机 Whisper 工具。
本测评基于公开资料整理,不构成购买建议,请以 whisperweb.net 官网实际信息为准。
免费本地转写,隐私友好,支持多语言。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。