自主渗透测试AI项目
PentestGPT 是一个由大语言模型驱动的自主渗透测试框架,定位不是普通聊天式安全助手,而是从 reconnaissance 到 exploitation、再到后渗透阶段的端到端自动化代理。页面显示其研究成果被 USENIX Security 2024 评为 Distinguished Artifact,并提供论文、团队和 GitHub 入口。
其架构由 reasoning、generation、parsing 三个自交互模块组成:分别承担战略规划、命令执行和输出分析,用于维持测试上下文并推进复杂攻击链。Agentic v1.0 将旧版需要逐步人工输入的模式升级为更自主的 pipeline,可进行目标发现、端口扫描、服务枚举、漏洞识别、payload 生成、exploit 选择、权限提升和横向移动。Docker-first 环境预装 20+ 安全工具,并支持会话保存与恢复,对长流程测试较实用。
页面明确强调由大语言模型提供领域知识,但未披露具体底层模型、是否可切换 GPT、开源模型或本地模型。结果部分显示,在 HackTheBox 机器和 CTF 挑战上的任务完成率:GPT-3.5 为 35%,GPT-4 为 47%,PentestGPT 为 80%,相对基线提升 228.6%。这说明其工程化闭环可能比单纯调用通用模型更有效。但评测样本、难度分布、失败类型、误报率和真实企业网络泛化能力未展开,实际使用仍需安全专家监督。
定价方面,正文仅说明“Open source and available now”,未给出商业版本或云服务价格;安装方式为 GitHub 克隆、make install/config/connect,并通过命令行指定 target。页面未说明 API、SDK、CI/CD 集成,也未披露数据隐私政策,例如目标信息、命令输出、凭据是否会发送给外部模型服务。因此在企业环境中使用前,应先审计代码、明确模型调用链和日志保存方式。
优点是开源、自动化程度高、Docker 部署降低环境配置成本,并将安全工具与 LLM 推理闭环结合。缺点是模型依赖、中文支持、合规与支持体系信息不足,且自动化攻击工具天然存在越权和误操作风险。更适合渗透测试工程师、安全研究者、HTB/CTF 用户和具备授权测试流程的团队,不适合缺乏安全基础的用户直接用于生产网络。
正文未提供中国大陆访问、支付或镜像信息,china_access 只能判定为未知。若 GitHub 或模型 API 访问受网络影响,可能需要自行解决网络、密钥和依赖下载问题。可替代方案包括 Kali Linux、Metasploit、Nmap、Burp Suite,以及其他本地化安全自动化脚本或代理框架。
本测评基于公开资料整理,不构成购买建议,请以 pentestgpt.com 官网实际信息为准。
USENIX论文项目,适合研究AI安全自动化。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。