端侧语音声纹视觉AI
Sensory 是一家面向设备端 AI 的语音、声音与生物识别技术供应商,核心不是通用聊天机器人,而是把唤醒、命令识别、离线转写和声纹验证放到本地硬件上运行。正文反复强调 on-device、offline、low power、privacy-first,明显定位于汽车、消费电子、移动/PC、医疗设备和零售 POS 等嵌入式或终端产品。
其产品线覆盖 Secure Wake Word、Speech-to-Text、Phrase Spotted Commands、Text-Dependent Speaker Verification 等。安全唤醒词把触发词与说话人验证结合,只有登记用户说出指定短语才唤醒;说话人验证采用轻量首阶段筛选加神经网络复核,兼顾功耗和安全。STT 支持 Android、iOS、桌面 OS、小芯片 bare metal 与混合云架构,英文模型提到 21-183MB,特殊模型可到 5.3MB,并称支持 40+ 语言和方言。命令识别则适合多条预定义指令的快速本地触发。
页面未披露价格、授权方式或免费额度,主要通过 Request a Demo、产品简报和案例研究获取。它强调离线 STT 没有云端按分钟计费依赖,可只把文本传给云端或 LLM,从而降低带宽和云 STT API 成本。集成方面支持移动 OS、桌面 OS、汽车平台、小芯片,也可与 wake word、SoundID、生物识别、Custom Grammars 和云/本地 AI 系统组合,但具体 SDK 文档与开发者门槛未在正文展开。
优点是隐私、低延迟、低功耗和弱网可用,尤其适合常开监听、车载控制、智能电视、门禁或医疗设备这类不能完全依赖云的场景。其 STT 还公开了英语公开测试集 WER,例如 LibriSpeech test-clean 无噪 4.0%。不足是定价不透明,面向企业集成而非个人即开即用;中文支持只笼统说多语言,未明确列出普通话或粤语;公开准确率也主要集中在英语,落地前必须做本地噪声、口音和设备麦克风测试。
它适合硬件厂商、车机团队、智能家居/电视厂商、医疗和零售设备开发者;不适合只想要 SaaS 在线转写或通用语音助手的轻量用户。中国访问、付款方式和本地销售支持正文未说明,判定为未知。若需要国内替代,可评估科大讯飞、百度智能云、腾讯云语音;若需要开源或端侧方案,可对比 Whisper/whisper.cpp、Vosk、Picovoice 等。
本测评基于公开资料整理,不构成购买建议,请以 sensory.com 官网实际信息为准。
低功耗端侧AI,适合硬件集成。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。