海外资源测评导航
返回AI 应用 海外资源 / AI 应用 / AI代码代理验证 / validity.ai
V
🤖 AI 应用 AI代码代理验证 美国总部 国内优化

validity.ai

验证AI代理写代码

7.0/10 中国可用
TTG4G 编辑组 ·更新于 2026-06-07 ·数据来源: ai_crawl 评测方法 ↗
数据来源
ai_crawl · 最近更新 2026-06-07
行业深度解析AI 深度分析
一句话Validity helps AI coding agents verify their own work by running changes in the actual app and reporting pass, fail, or unverifiable results.
定价Free alpha, invite-only Validity is currently free to use during alpha. Access is invite-only and opened manually. The company may introduce paid plans in the future with at least 30 days notice via email
适合谁Developers using AI coding agents, especially Claude, Cursor, and Codex users who need validation before merging AI-generated code.
核心功能AI coding agent work verificationRuns changes in the actual applicationValidation report with passfailor unverifiable verdictsBrief reason for each validation itemCLI and MCP serverMCP-based integration with coding agentsPlaywright screenshot capture mentioned in termsQuick initialization in about 30 seconds
AI能力与模型Validity 使用人工智能评估 AI coding agent 的工作,包括解释验收标准、分类验证结果、生成诊断说明。条款披露当前使用第三方 AI 服务 Anthropic。AI 输出可能不准确、存在幻觉或误导。
典型用例面向不完全信任 AI 编码代理“looks good to me”的开发者,用于在 merge 前检查 AI 生成代码是否真的完成;适合 Claude、Cursor、Codex 用户通过 MCP 让代理自动验证自己的工作。
免费额度/试用当前处于免费 alpha 阶段,需登录申请邀请名额;访问由团队手动开放,开放后会发送安装命令。
定价alpha 期间免费。未来可能推出付费计划,若对现有客户收费,将至少提前 30 天通过账户邮箱通知。未披露正式价格。
API与集成提供 Validity 网站、CLI 和 MCP server。代理可通过 MCP 在认为任务完成时自动请求 Validity 验证。页面提到初始化约 30 秒。条款中提及 Playwright 截图可能被用于 AI 功能处理。
数据隐私用户保留输入内容所有权,包括代码、配置、截图和验证结果。服务获得有限许可用于提供服务。数据传输强制加密。取消账户后内容立即不可访问,30 天内从活动系统删除,60 天内从备份删除。AI 功能数据可能发送给 Anthropic,包括代码片段、Playwright 截图和验收标准。
输出质量与局限输出为每项 pass、fail 或 unverifiable,并附简短原因。但服务仍处 alpha,不保证正常运行、数据完整性或持续访问;AI 生成内容可能不准确,pass 只是辅助信号,不能替代人工审查、安全审查或专业工程判断。
中国访问未知
适用场景在合并 AI 生成代码前进行真实性检查;让 Claude、Cursor、Codex 等编码代理通过 MCP 自动请求验证;对功能验收项生成 pass/fail/unverifiable 报告;辅助开发者发现代理未能完成或无法验证的任务。
同类传统自动化测试框架、CI/CD 流水线、Playwright、单元测试与集成测试工具,以及 Claude、Cursor、Codex 自带工作流中的人工审查机制
性价比7
易用7
服务4
综合6
优点
  • 定位清晰,专注解决 AI 编码代理“声称完成但实际未完成”的问题
  • 通过 MCP 让 Claude、Cursor、Codex 等代理自动触发验证
  • 可在真实应用环境中运行变更并给出逐项 verdict
  • alpha 期间免费使用
  • 明确声明用户保留代码、配置、截图和验证结果的所有权
不足
  • 目前处于 alpha,功能、稳定性和可用性均无保证
  • 仅邀请制开放,需要手动放行,无法即刻使用
  • AI 生成的验证解释可能不准确,不能替代人工代码审查
  • 会将代码片段、Playwright 截图、验收标准等数据发送给第三方 AI 服务 Anthropic 处理
  • 未披露正式定价、企业功能、SLA 或详细技术能力边界

深度测评

TG4G · 2026-06-07 更新 · 仅供参考

是什么

Validity 是 Spaceship Studio, LLC 推出的 AI 编码代理验证工具,目标是减少“代码几乎能用但未真正完成”的情况。它让 AI coding agent 在认为任务完成后,通过 Validity 在真实应用中运行变更,并按验收项返回 pass、fail 或 unverifiable 结论及简短原因。

核心能力与集成

产品核心不是写代码,而是验证 AI 代理声称完成的工作。页面明确面向 Claude、Cursor、Codex 用户,代理可通过 MCP 自动请求验证;服务形态包括网站、CLI 和 MCP server,官方称初始化约 30 秒。条款说明其 AI 功能会解释验收标准、分类验证结果并生成诊断说明,当前使用 Anthropic 作为第三方 AI 提供方。

定价与试用

Validity 当前处于免费、邀请制 alpha。用户需登录申请名额,团队手动放行并发送安装命令。正式商业模式尚未披露;条款称未来可能推出付费计划,若收费会至少提前 30 天通过账户邮箱通知。

优缺点与局限

优点是场景非常聚焦:为 AI 生成代码在 merge 前提供现实检查,尤其适合不想只依赖代理自述的开发者。MCP 集成也符合当前 AI 编码工具链趋势。局限同样明显:alpha 阶段无 SLA,不保证 uptime、数据完整性或功能稳定;AI verdict 可能错误,官方也强调 pass 只是审查信号,不能替代人工代码审查。隐私方面,代码片段、Playwright 截图、验收标准可能被发送给 Anthropic 处理,企业或敏感项目需谨慎评估。

适合谁与中国访问

它适合已经在使用 Claude、Cursor、Codex 等 AI 编码代理,并希望在合并前增加自动化验收检查的个人开发者和小团队。不适合需要稳定 SLA、明确合规承诺或立即大规模接入的企业。中国大陆访问、支付方式和中文界面均未在正文说明,判断为未知;替代方案可考虑现有 CI/CD、Playwright、单元/集成测试及人工 code review 组合。

本测评基于公开资料整理,不构成购买建议,请以 validity.ai 官网实际信息为准。

中文卖点

让AI编码代理在真实应用中自测,切中AI开发痛点。

官网快照

/shot/validity-ai.png
validity.ai

价格走势

当前价 · 仅供参考
价格未公开 当前定价
价格采集自官网公开页面,实时更新;历史走势数据采集中,暂无足够历史样本。下单请以官网实时价为准。

用户评价

综合评分
7.0/10
TG4G 综合评分

评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。

常见问题

validity.ai 是一家美国的AI 应用 (AI代码代理验证)服务商. 本页收录其「验证AI代理写代码」套餐. 让AI编码代理在真实应用中自测,切中AI开发痛点.
validity.ai 在中国大陆基本可用, 但部分时段可能出现延迟, 建议有备用线路. 该商家总部位于美国, 主要面向海外市场.
访问 validity.ai 官网完成注册即可使用. 注册一般需要邮箱 (推荐 Gmail/Outlook) 和支付方式. 多数海外服务支持信用卡 / PayPal / 加密货币. 完整流程见本页"前往官网"按钮.

浏览其他大类