端侧语音识别SDK
Keen Research 提供的 KeenASR SDK 是一套端侧自动语音识别方案,面向 iOS、Android、Web、Unity、Linux、ChromeOS 和定制硬件。它不是面向个人的转写 App,而是给开发团队嵌入到教育、游戏、企业移动应用或硬件产品中的语音识别引擎。
其核心卖点是本地识别:语音数据在设备上处理,不依赖云端 ASR,也无需自建后端。页面称引擎基于深度神经网络,支持实时结果、连续监听、触发短语、语言模型/解码图、声学模型定制,并可输出置信度、时间、发音等信号。典型场景覆盖儿童阅读逐词评测、发音反馈、互动游戏、仓储拣货、飞行/检查清单、PoS/kiosk 和定制语音助手。开箱语言为英语、西班牙语、德语、法语,英语有儿童语音优化模型;中文未明确。
平台覆盖较完整:iOS Objective-C/Swift、Android Java AAR、Web JavaScript、Unity C#、Linux C++/Python。官方提供文档、Quick Start、API Reference、GitHub PoC 应用,以及 Dashboard 调试工具。Dashboard 可查看录音、识别结果、置信度、设备信息和 JSON payload,适合调参评估;但它默认关闭,且仅用于开发测试,不适合生产合规场景。
KeenASR 提供免费试用 SDK,功能完整,但每次只能运行 15 分钟,之后会让应用崩溃;可无限次重启继续测试。商业授权需要联系官方,未披露具体价格。页面多次强调无按调用计费,采用年度许可思路,适合高频语音交互、希望避免云 ASR 调用成本的产品。
优点是离线可用、低延迟、隐私友好、平台覆盖广,并且对儿童语音、阅读评测、仓储噪声环境和领域词汇有明确定位。缺点是价格不透明,中文能力未知,大词汇量或垂直领域可能需要额外语料和定制;触发短语也不适合 24x7 常开监听。它更适合有工程团队的 EdTech、游戏、企业移动和硬件厂商,不适合只想快速获得通用中文转写的个人用户。
抓取内容未说明中国大陆访问、付款方式或本地合规支持,访问状态判定为未知。若需要中文识别或国内部署,可同时评估科大讯飞、百度智能云、阿里云、腾讯云,以及本地化开源方案如 Vosk、Whisper/whisper.cpp。
本测评基于公开资料整理,不构成购买建议,请以 keenresearch.org 官网实际信息为准。
隐私优先、离线ASR,适合移动端语音应用。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。