本地浏览器OCR识别
ocr.cat 是一个面向浏览器的 OCR 工具,页面标题显示其使用 Tesseract.js,支持加泰罗尼亚语、卡斯蒂利亚语/西班牙语和英语的图片文字识别。用户可以拖拽图片、通过 Ctrl+V 粘贴图片,或点击选择文件,并且支持多文件选择,定位更接近轻量级在线 OCR 页面,而不是完整的企业级文档智能平台。
从正文看,它的核心功能是图片转文字,语言覆盖集中在 Català、Castellà 和 Anglès 三类。技术栈方面明确提到 Tesseract.js,这对开发者有一定参考价值:它可能适合前端侧 OCR、低门槛演示或小型工具二次开发。页面提供 GitHub 源码链接“ocr-en-catala”,说明项目至少开放了源码入口,但正文未说明许可证、构建方式、部署步骤或维护状态,因此不能确认其开源授权和自托管成熟度。API/SDK 方面没有公开说明,也未见 Webhook、CLI、批处理接口等能力。
页面未显示任何收费信息、账号体系或套餐限制,按现有文本只能判断其未公开商业定价。生态上主要依赖 Tesseract.js,并提示如果文本包含方程式,最好使用 pix2text,这表明它不主打公式 OCR 或复杂版面解析。
优点是使用方式直观,支持拖拽、粘贴和多文件选择,适合快速提取普通图片中的加泰罗尼亚语、西班牙语或英语文本。缺点是信息披露较少:没有识别准确率、隐私处理、文件大小限制、浏览器兼容性、API 和部署文档。它适合个人、学生、资料整理者和希望参考 Tesseract.js OCR 实现的开发者;不太适合需要 SLA、权限管理、复杂表格/公式识别或大规模自动化处理的团队。
正文没有提供网络可用性信息,因此中国访问状态只能标为未知。若访问 GitHub 源码,国内网络可能受 GitHub 连通性影响。含公式识别场景可按页面建议考虑 pix2text;若需要更完整的中文或多语言 OCR,也可评估自建 Tesseract.js 方案或其他 OCR 服务。
本测评基于公开资料整理,不构成购买建议,请以 ocr.cat 官网实际信息为准。
Tesseract.js客户端识别,隐私友好免费用。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。