LLM模型评测工具站
各维度得分依据公开资料与字段推算,加权后即综合评分,仅供参考。
LLMx 是一个聚焦“大模型选型”的独立内容与基准网站,主张用基准、价格数据和开发者工具指南帮助用户选择合适模型,而不是只看营销或排行榜。页面显示作者 Dmytro Chaban 位于德国,具备 10 年以上软件开发、4 年以上 AI 系统经验。
它本身并不提供 LLM 推理服务,而是提供研究型内容:例如 39 个模型、32 个对抗测试的“误信息抵抗”基准,以及按订阅和 API 两种购买方式拆分的 LLM 价格表。典型读者是开发者、AI 工程师和自动化团队,用来判断 Claude、GPT、Gemini、DeepSeek、Kimi 等模型在编码、推理、长上下文、成本和速度上的取舍。文章还给出 OpenRouter、Continue、Aider 等集成示例,对实际开发工作流有参考价值。
抓取内容未显示 LLMx 自身收费,文章和基准看起来可免费阅读,并支持邮件订阅更新。文中大量定价属于第三方模型或订阅服务,不应理解为 LLMx 的收费。支付方式、企业版、API 或账户体系均未见说明。中国大陆访问情况无法从文本判断,若依赖其引用的 OpenAI、Anthropic、Google 等服务,实际使用可能受到网络、账号和支付限制影响;可替代参考包括 Artificial Analysis、Chatbot Arena、OpenRouter 排行榜和各厂商官方价格页。
优点是定位垂直、信息密度高,尤其适合需要在订阅与 API 成本之间做决策的技术用户;它还强调按任务路由模型,而不是简单追求单一最强模型。局限在于站点更像分析媒体而非工具平台,抓取文本未提供完整实验数据下载、复现实验流程、中文支持、详细隐私条款或客服支持。部分模型版本和 2026 年内容也需要读者结合官方页面核验时效性。
适合需要快速了解 LLM 市场价格、模型能力边界和开发者工具配置的工程团队;不适合想直接购买模型 API、寻找中文客服或需要企业合规承诺的用户。
本测评基于公开资料整理,不构成购买建议,请以 llmx.tech 官网实际信息为准。
提供模型基准和价格数据,利于选型。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。