区域路由语音转写API
regn.io 的 Supreme 1 是一款专注英文电话音频的语音转文字模型与 API 服务,目标不是覆盖所有音频场景,而是用较低成本处理 GSM、G.711、PCMU/PCMA、低码率 Opus、呼叫中心 WAV 等粗糙电话音频。它支持批量 HTTPS 上传和实时 WebSocket 流式转写,输出可为文本、富文本、JSON、CSV、segments 与 timings。
模型为专有 Supreme 1,正文披露规模为 134M 参数,支持 GPU FP32/FP16 与 CPU INT8 运行。速度标称 150-500x,实时接口为 65x realtime。API 设计较工程化:冷区域会返回 202 queued、job_id、poll_url 和 route_status,客户端需轮询任务状态。其明确局限是“English telephony first”,不适合干净棚录、媒体音频或多语言语音;中文支持未披露,应视为不明确或不支持。
价格是最大亮点:Supreme 1 为 $0.000099/分钟,并提供每 IP 2 小时 WAV 免费测试。页面还对比了 whisper-1 的 $0.006/分钟,显示其面向大规模电话录音的成本优势。托管版有 Standard、Optimized、Accelerated 层级;私有云或本地部署需要定制报价。
优点是价格极低、电话音频定位清晰、支持批处理和实时流、输出格式丰富,文档也详细解释了路由、冷启动、扩缩容和轮询机制。缺点是应用面窄,冷启动可能带来等待,且隐私政策、支付方式、服务支持渠道、公司所在地等信息未在正文中充分披露。它适合呼叫中心、客服质检、语音信箱归档和英文电话流实时转写团队;不适合中文语音、会议录音、多语言媒体字幕等通用场景。
中国大陆访问状态正文未说明,网络可用性、支付方式也未知。若项目要求中文识别、国内合规或低延迟访问,应同时评估国内云厂商语音识别服务;若只处理英文电话音频,可将 regn.io 作为低成本 API 备选,并先用免费 WAV 测试验证识别质量与连通性。
本测评基于公开资料整理,不构成购买建议,请以 regn.io 官网实际信息为准。
面向开发者的STT API,有区域路由卖点。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。