多LLM协作推理框架
各维度得分依据公开资料与字段推算,加权后即综合评分,仅供参考。
LLM Council 是一个开源开发者工具,核心思路不是让单个大模型直接回答,而是把问题并行发送给多个 LLM,例如 GPT、Claude、Gemini、Grok 等,再让各模型匿名评审和排序其他回答,最后由 Chairman LLM 综合生成最终答案。它适合需要多模型交叉验证的代码审查、架构决策、内容校验和复杂问题分析。
工具支持 MCP Server、HTTP API 和 Python Library 三种形态。HTTP 版本提供 /health、/v1/council/run 和 SSE 流式 /v1/council/stream,并带有 Swagger UI、ReDoc、OpenAPI JSON。调用方可以用 Python、JavaScript/TypeScript 或 cURL 接入。认证方面支持本地 Bearer token;模型网关支持 OpenRouter、Requesty,也可直连 Anthropic、OpenAI、Google 等 API。n8n 集成文档较细,覆盖 Webhook、HMAC 签名、异步事件、工单分流和 PR 审查等场景。
正文显示 OSS package 为 MIT-licensed,核心算法开源;同时存在专有的 council-cloud,用于生产环境中的认证、计费、缓存、审计日志等。OSS 版本采用 BYOK,本身未显示收费,但用户需要承担多个模型调用费用。部署上支持本地 HTTP Server、本地 Docker、Railway、Render,设计原则是无状态、单租户、无数据库、日志仅输出到 stdout。
优点是架构清晰,匿名互评能减少模型偏好,Borda 排名、二元裁决、tie-breaker、include_dissent 等机制适合工程决策。文档质量较好,API、n8n、安全建议和 ADR 都比较完整。缺点是多模型 deliberation 天然增加成本和延迟,文档提示可能需要 30-60 秒;OSS 服务不提供完整生产级多租户、持久化、审计和计费能力。
它适合 AI 工程师、架构师、DevOps 自动化团队,以及希望在 Claude Code、n8n 或内部工具中引入多模型评审的团队。中国大陆访问情况正文未说明;但其依赖 OpenRouter、OpenAI、Anthropic、Google 等外部 API,网络连通性与支付可用性存在不确定性。若受限,可考虑自建类似 LangChain/LlamaIndex/Vercel AI SDK 工作流,或接入可用的本地/国内模型网关。
本测评基于公开资料整理,不构成购买建议,请以 llm-council.dev 官网实际信息为准。
开源AI推理框架,适合开发者研究集成。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。