一句话Markdocify 是一款开源的命令行工具,可将任意文档网站转换为适合大语言模型使用的干净结构化Markdown。
定价免费开源 完全免费开源,无付费订阅或功能限制
适合谁AI开发者、开发团队、需要离线文档的个人开发者、企业AI团队
核心功能支持三种使用方式:粘贴URL直接转换、命令行自定义参数、YAML配置文件适配复杂场景零配置开箱即用,只需输入文档URL即可启动转换输出为LLM优化的干净Markdown,自动移除导航、广告、侧边栏等冗余元素,保留代码块与结构化标题支持并发处理、智能限流,可恢复中断任务,能稳定处理百页以上的大型文档网站提供Homebrew、Go、Docker、二进制文件等多种安装方式,支持macOS/Linux系统适配Next.js、React、Stripe API、Python等主流文档站的转换需求
功能与用途Markdocify 是一个面向文档站点的转换工具,核心用途是把任意文档 URL 转换为干净、结构化、LLM-ready 的 Markdown。它强调零配置、去除导航/广告/侧边栏等页面噪音、保留代码块和标题结构,适合生成 llms.txt、RAG 知识库、AI 训练数据和离线文档。
支持语言/框架正文未说明其实现语言或可解析的编程语言范围;示例覆盖 Next.js Docs、React Docs、Stripe API、Python Docs 等文档站点。安装方式包含 Homebrew、Go Install、Docker 和 Binary。
开源还是闭源页面提供“View on GitHub”,可判断有 GitHub 仓库;但正文未明确许可证类型,是否完全开源需查看仓库确认。
自托管选项提供命令行本地运行方式,并支持 Docker 与二进制安装,因此可在本地或自有环境运行。正文未提及托管云服务。
定价正文未出现付费计划或订阅价格;结合 GitHub 与本地安装信息,当前可视为免费/开源工具,但是否存在商业支持未说明。
API/SDK正文仅展示 CLI 用法,如 markdocify https://nextjs.org/docs、-d、--concurrency、-c 等参数;未提及 HTTP API、SDK 或库级调用能力。
集成与生态支持 Homebrew、Go Install、Docker、Binary 多种安装渠道;面向 llms.txt、RAG、AI training、knowledge bases 等工作流。未提及与 GitHub Actions、CI/CD、向量数据库或文档平台的直接集成。
文档质量首页信息较清晰,包含三种使用方式、安装示例、典型站点性能数据和转换前后对比;但正文未提供完整参数说明、配置文件 schema、错误处理、鉴权站点、限速策略等深入文档信息。
支付无需付费
中国访问可直连(GitHub仓库可直连访问)
适用场景['生成RAG系统、大语言模型训练所用的干净文档数据集''制作可离线访问的个人技术文档库''搭建团队内部可搜索的知识文档库''批量抓取整理官方文档生成llms.txt文件']
同类Firecrawl、Jina Reader、Trafilatura、Readability、crawl4ai、Docusaurus/Docs 原始仓库导出方案