海外资源测评导航

tg4g海外资源测评导航

返回pentest 海外资源 / pentest / AI安全评测基准 / cybercapabilities.org

📦 pentest AI安全评测基准未知总部国内优化

cybercapabilities.org pentest测评

Name: cybercapabilities.org - AI网络攻击能力基准
Brand: cybercapabilities.org
Rating: 8.0 (1 reviews)

AI网络攻击能力基准

8.0/10 中国可用

TTG4G 编辑组 ·更新于 2026-06-07 ·数据来源: ai_pentest 评测方法 ↗

数据来源

ai_pentest · 最近更新 2026-06-20

⚡ 评分构成

五维加权 · 满分 10

性能 / 功能25% 8.0

性价比20% 8.0

中国可用度20% 10.0

口碑20% 6.4

售后 / 退款15% 7.5

各维度得分依据公开资料与字段推算,加权后即综合评分,仅供参考。

行业深度解析AI 深度分析

一句话3CB 是用于评估 AI Agent 自主网络攻击能力的基准测试，基于原创挑战与 MITRE ATT&CK 技术分类衡量模型风险。

适合谁AI安全研究人员、网络安全评测团队、模型开发者、政策与风险评估研究者

核心功能评估 AI Agent 自主网络攻击能力原创挑战以降低记忆化影响每个挑战对应真实网络攻击能力演示使用 MITRE ATT&CK 技术进行系统化分类提供论文、博客、代码、排行榜和数据浏览器按完成挑战数量对模型潜在风险分级

AI能力与模型3CB 本身不是模型，而是用于评估 AI agents 自主网络攻击能力的基准。正文称其通过模型完成挑战数量来分类风险，并用于比较不同 AI 模型在网络攻击操作中的覆盖能力。

典型用例用于自主网络攻击能力评测、模型风险分级、MITRE ATT&CK 技术覆盖分析、AI 安全研究与论文复现。

API与集成正文提到提供 Code、Leaderboard and data explorer，但未说明是否有 API 或第三方集成。

数据隐私正文未说明数据隐私政策。伦理声明提到项目可能被误用，并因威胁行为者可能使用脚手架和挑战训练前沿 Agent，未发布四个最困难挑战。

输出质量与局限优势在于原创挑战、真实演示对应、系统化 MITRE ATT&CK 分类，有助于减少记忆化并提升覆盖分析。局限包括部分挑战未公开，且正文仅说明与原始 LLM 查询相比性能差距有限，未提供具体榜单数据或完整评测结果。

中国访问未知

国内可用性🔎 查任意海外服务在中国能不能用 →

适用场景评测不同 AI 模型或 Agent 的自主网络攻防能力；研究前沿模型在网络攻击任务中的潜在风险；基于 MITRE ATT&CK 框架分析模型能力覆盖范围；为 AI 安全治理和模型发布风险评估提供证据。

性价比7

易用5

服务4

综合7

优点

挑战设计强调原创性、覆盖度与泛化评估
采用 MITRE ATT&CK 映射，便于安全行业理解和横向比较
提供排行榜和数据浏览器，增强评测透明度
有伦理说明，并因滥用风险保留部分高难挑战

不足

正文未披露完整使用流程、部署门槛和运行成本
未说明中文支持、API接口、服务支持或商业化定价
部分高难挑战未公开，可能限制复现实验的完整性
该项目偏研究评测，不是面向普通用户的AI工具

深度测评

TG4G · 2026-06-07 更新 · 仅供参考

是什么

3CB（Catastrophic Cyber Capabilities Benchmark）是一个用于评估 AI Agent 自主网络攻击能力的基准测试项目。它关注的问题是：当 AI Agent 具备黑客能力时，如何可靠判断其能力边界与潜在风险。正文显示，项目提供 explainer paper、blog post、code、leaderboard 和 data explorer，更偏向研究与安全评测基础设施，而不是普通生产力工具。

核心能力与评测方法

3CB 的主要特点是使用原创挑战，意在避免模型因训练数据记忆而在评测中虚高；每个挑战还对应一个真实网络攻击能力演示，并映射到 MITRE ATT&CK 技术，例如 bashhist 对应 T1552.003。相比零散 CTF 式题目，这种系统化分类有助于分析模型在自主网络攻击操作中的覆盖范围。排行榜按模型解决挑战数量进行风险分级：解决 13 个以上被标为高潜在风险，8 个以上为有限潜在风险。

定价、集成与支持

抓取文本未披露商业定价、免费额度、试用、支付方式或服务支持信息。项目提到提供代码、排行榜和数据浏览器，但没有说明是否存在 API、SDK、云端托管服务或企业集成能力。因此它更适合具备研究和工程能力的团队自行运行或参考，而不适合作为开箱即用 SaaS。

优缺点

优点是评测设计较严谨：原创挑战降低记忆化干扰，MITRE ATT&CK 映射提升可解释性和行业可沟通性，排行榜有助于横向比较模型风险。项目也包含伦理声明，承认脚手架和挑战可能被滥用，并选择不发布 sshhijack、bashhist、nodecontrol、rce 四个最困难挑战。局限是部分关键挑战不公开会影响完整复现；正文未提供具体模型结果、运行要求、中文支持或隐私政策。

适合谁与中国访问

3CB 适合 AI 安全实验室、网络安全研究人员、模型开发者和治理评估团队，用于衡量前沿模型的自主网络攻击风险。中国访问情况正文未说明，域名连通性、代码平台访问和支付问题均未知；若无法稳定访问，可考虑参考其论文与 MITRE ATT&CK 思路，自建内部安全评测集。

本测评基于公开资料整理,不构成购买建议,请以 cybercapabilities.org 官网实际信息为准。

📢 订阅 TG4G 电报频道

每日精选海外资源 + 国内可用性速报 · 也可在 @amzseo_bot 直接搜

加入频道 →

中文卖点

评估AI Agent自主网络攻防能力，研究价值高。

官网快照

/shot/cybercapabilities-org.png

cybercapabilities.org

快照生成中 · 后端每周自动抓取官网首页

价格走势

当前价 · 仅供参考

价格未公开当前定价

价格采集自官网公开页面,实时更新;历史走势数据采集中,暂无足够历史样本。下单请以官网实时价为准。

用户评价

综合评分

8.0/10

TG4G 综合评分

评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。

常见问题

cybercapabilities.org 是一家未知的pentest (AI安全评测基准)服务商. 本页收录其「AI网络攻击能力基准」套餐. 评估AI Agent自主网络攻防能力，研究价值高.

cybercapabilities.org 综合评分 8.0/10, 总部未知. 是什么 3CB（Catastrophic Cyber Capabilities Benchmark）是一个用于评估 AI Agent 自主网络攻击能力的基准测试项目。它关注的问题是：当 AI Agent 具备黑客能力时，如何可靠判断其能力边界与潜在风险。正文显示，项目提供 explainer pap... 完整深度测评见本页下方.

cybercapabilities.org 在中国大陆有较好的直连体验, 多数地区无需代理即可访问. 该商家总部位于未知, 主要面向海外市场.

访问 cybercapabilities.org 官网完成注册即可使用. 注册一般需要邮箱 (推荐 Gmail/Outlook) 和支付方式. 多数海外服务支持信用卡 / PayPal / 加密货币. 完整流程见本页"前往官网"按钮.

浏览其他大类

🌾 农业食品 🤖 AI 应用 🔗 API 数据 🚪 API 网关 🧊 3D素材 🚗 汽车出行 🗃 备份容灾 📋 公司合规 📡 智能盒子 🧱 建站模板 🌐 CDN 💬 聊天 App ☁ 网盘云盘 📖 漫画网文 ✉ 通讯邮箱 🏢 跨国名企 💰 加密 🗄 托管数据库 🏷 比价优惠 🎨 设计创意 🔧 开发工具 📡 DNS 解析 🌍 域名 ⬇ 下载软件 🛒 电商 📚 教育课程 📧 邮件发送 ⚡ 能源环保 🎫 活动票务 🎪 会展展会 📤 文件传输 🏦 金融钱包 📝 表单调研 💭 论坛社区 💸 众筹融资 🎮 游戏服务 🎮 游戏市场 🕹 游戏平台 🎁 订阅礼品卡 🏛 政府机构 🎯 GPU 算力 🔌 硬件 IoT 🩺 医疗健康 👔 招聘远程 🖼 图片灵感 🛡 保险 💼 求职招聘 📒 知识笔记 ⚖ 法务财税 📍 本地生活 📦 物流货运 🔎 生活查询 🗺 地图导航 📈 营销 SEO 📺 流媒体订阅 🎞 家庭影音 📰 新闻资讯 🤝 公益慈善 📄 办公协作 🌍 国际组织 ☁ 应用部署 🎛 主机面板 🔑 密码安全 💳 支付 🐾 宠物 👕 印刷定制 🎙 播客有声 🔌 代理 ❓ 问答内容 🏠 房产租售 ⚡ 实时通信 🖥 远程桌面 🗂 资源站 ⚙ SaaS ♻ 二手交易 🛡 安全 📱 短视频直播 📲 接码虚拟号 💬 社交约会 🔐 SSL 证书 💾 云存储 🎓 留学教育 🎧 在线客服 🧰 在线工具 🌐 翻译本地化 ✈ 旅游出行 🏛 全球大学 🚀 加速器 VC ▶ 视频平台 🎬 视频托管 🔒 VPN 隐私 🖥 服务器 🌐 虚拟主机 🔏 零信任组网