LLM驱动Lean4证明引擎
Perqed 是一个开源 Autonomous Proof Engine,核心目标是在 Lean 4 中自动搜索数学见证、生成证明并进行机器验证。它不是通用聊天机器人,而是面向自动定理证明与形式化数学研究的工具,目前聚焦 open Ramsey number problems 和 Torus Decompositions,并已有关于 m=4、m=6 Directed Hamiltonian Torus Decompositions 的机器检查证明论文与源码。
其架构是典型的混合证明闭环:Gemini 2.5 Flash 负责读取猜想、制定策略、解释失败模式和提出新搜索方向;8 个并行 Simulated Annealing workers 做大规模启发式搜索;Z3 负责结构化子空间的 SMT 快速检查,以及对 near-witness 的 LNS 修复;找到 witness 后编译为 Lean 4 proof,并由 Lean kernel 通过 decide 或 tactic mode 检查。对于非构造性目标,DeepSeek Prover V2:7B Q8 通过本地 Ollama 生成 Lean tactic。
正文未提供商业订阅或托管服务价格。项目强调核心搜索和 tactic generation 运行在本地硬件;Gemini 仅承担战略规划,给出的成本约为每次运行 0.02 美元。DeepSeek Prover 本地运行约需 7GB VRAM,Apple Silicon 上每次补全约 1–2 秒。因此总成本更接近“开源工具 + 本地算力 + 少量外部模型 API”。
优点是技术链路完整:搜索、SMT 修复、LLM 策略规划和 Lean 4 kernel 验证相结合,证明可靠性不只依赖模型生成文本;GitHub、论文和实时 proof feed 也提升了透明度。局限在于门槛很高,需要理解 Lean 4、Z3、Ollama、本地运行环境和数学问题建模;当前适用领域较窄,搜索失败时也不能保证产出证明。正文未说明完整安装文档、企业支持、隐私政策或稳定版本信息。
Perqed 更适合形式化验证研究者、组合数学研究团队、Lean 4 用户和自动定理证明开发者,不适合普通办公或内容生成场景。中国访问方面,正文未提供网络可用性信息;GitHub、Gemini API、Ollama 模型获取等环节在国内可能存在不确定性,支付方式也未披露。若受限,可考虑 Lean 4、Z3、Coq、Isabelle/HOL、DeepSeek Prover 等工具链组合替代。
本测评基于公开资料整理,不构成购买建议,请以 perqed.com 官网实际信息为准。
开源神经符号AI证明系统,技术含量高。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。