一句话支持精准溯源引用的文档结构化数据提取API,解决LLM输出信任问题
定价按月订阅+按使用量阶梯计费 Starter套餐99美元/月,约0.10美元/页,每月含1000页额度,提供Cloud API与基础支持
适合谁受监管行业开发人员、文档审核团队、审计合规人员、AI工具构建者
核心功能每提取字段附带精确页码、文本 bounding box 与来源片段点击提取实体可直接跳转至PDF对应位置并高亮来源支持自托管部署,敏感数据无需流出自有基础设施简单API集成:提交PDF与提取JSON schema即可返回带引用的结构化数据提供React/JS嵌入式组件,快速接入侧栏验证UI每个提取结果附带置信度分数,辅助标注需人工审核的边缘案例
AI能力与模型CiteLLM用于从PDF中按用户提供的JSON Schema抽取结构化数据,并为每个字段生成页码、bounding box、source snippet和confidence score。文本强调其定位不是单纯LLM抽取,而是给LLM输出增加验证层;未披露具体底层模型、OCR引擎或训练方式。
典型用例适用于M&A尽调、贷款承保、合同分析、保险理赔、SEC/监管文件分析、发票抽取等。核心场景是长PDF或多文档工作流中,需要证明每个数字、条款或结论来自哪里,并支持人工复核和审计。
免费额度/试用页面未显示免费额度或公开试用。主要入口为Request Access、Schedule Demo和Get API Key。
定价Starter 99美元/月,1,000页/月,约0.10美元/页;Growth 499美元/月,8,000页/月,约0.06美元/页,额外页0.08美元/页;Enterprise定制,支持自托管、本地部署、定制集成和专属支持。
中文支持API options中有language字段,默认auto,表示可传入文档语言提示或自动识别。但文本没有明确说明中文界面、中文文档抽取质量、中文OCR或中文客服支持。
API与集成提供REST API,Base URL为https://api.citellm.com,主要端点包括POST /v1/extract、POST /v1/documents、GET/DELETE documents、GET extractions。支持Bearer Token认证,Python、Node.js、cURL、Go示例;Growth包含Widget SDK,页面说明有React/JS嵌入组件。
数据隐私云API可直接使用;企业版支持Docker自托管、on-premise、air-gapped support和full data sovereignty,宣称敏感文档可不离开用户基础设施。文档也支持删除document及关联extractions。未看到更细的加密、数据保留期限或合规认证说明。
输出质量与局限输出包含置信度,文档给出0.95以上高置信、0.85-0.94中等、0.70-0.84低置信、0.70以下建议人工抽取的解释,并支持confidence_threshold过滤。局限在于抽取仍可能有低置信或不确定结果,需要human-in-the-loop;网站未提供独立基准测试、准确率指标或复杂版式失败案例。
支付['']
中国访问未知
适用场景['金融科技与贷款场景提取、验证收入等关键财务数据''受监管行业的合规文档结构化与审计追溯''企业内部大量PDF文档的可信结构化提取''AI文档工具的信任层搭建,提升用户采纳率']
同类Google Document AI、AWS Textract、Azure AI Document Intelligence、Rossum、Mindee、Unstract、LlamaParse