图片文档转Markdown
各维度得分依据公开资料与字段推算,加权后即综合评分,仅供参考。
LlamaOCR.com 是一个面向“图片转结构化 Markdown”的 OCR 工具,页面显示其由 llama-ocr 与 Together AI 驱动。用户可以上传或拖拽图片进行识别,也可以试用示例图片。其目标不是传统只输出纯文本的 OCR,而是直接生成 Markdown,便于后续编辑、归档、写入知识库或接入自动化流程。
从抓取内容看,当前明确支持的是图片上传识别,PDF 仅标注为“soon”,尚未正式支持。页面提供了开发者代码示例:通过 llama-ocr 包调用 ocr(),传入本地文件路径与 TOGETHER_API_KEY 后返回 markdown。这说明它不仅是网页小工具,也可作为开发集成方案使用。不过正文没有披露具体底层模型、语言覆盖、复杂表格/公式/手写体表现,也没有提供识别准确率或评测样例。
页面没有说明独立定价、免费额度或调用限制,仅能看到需要 Together AI API Key,因此实际使用成本可能取决于 Together AI 的 API 计费,但网页本身未给出明确价格。隐私方面也缺少关键信息,例如上传图片是否保存、保存多久、是否用于训练、是否支持删除等。对处理票据、合同、证件等敏感材料的用户来说,这是需要谨慎评估的部分。
它的优点是定位清晰、上手入口简单,并且输出 Markdown 对内容整理和 RAG/知识库场景友好;同时代码示例降低了开发者集成门槛。局限也很明显:网页信息较少,PDF 未上线,中文支持未知,价格与隐私政策缺失,非技术用户若需要配置 Together API Key 可能会有一定门槛。更适合开发者、内容运营、研究助理或需要把图片文档批量结构化的人群。
中国大陆访问情况正文未提供,实际网络连通性与 Together AI API 可用性也需自行测试;支付方式同样未知。若需要更成熟的企业级 OCR,可对比 Google Cloud Vision OCR、Azure AI Document Intelligence、AWS Textract;若偏向本地化和中文场景,可关注 PaddleOCR 等替代方案。
本测评基于公开资料整理,不构成购买建议,请以 llamaocr.com 官网实际信息为准。
基于llama-ocr/Together AI,适合文档解析试用。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。