研究AI安全评测
DSRI聚焦AI公共安全的独立测试与评估(IT&E),目标是研究能够最终支持AI安全认证的方法和工具。它并不是传统意义上的生成式AI应用,而是面向评估者、研究者、认证机构和AI采用方的安全评测体系与原型工具集合,核心问题是帮助识别AI输出可能带来的公共危害。
其“Public Risk Analytics”覆盖四类方向:媒体取证分析,用于检测、定位和分类合成或篡改的图片、音视频片段;年龄筛查分析,用于识别成人语言、性露骨、暴力等不适宜内容;心理伤害分析,用于发现AI生成内容中的潜在心理危害;网络漏洞分析,用于检测代码和软件容器中的安全漏洞。网站还展示了视频/音频拼接检测、图像编辑检测等挑战,说明其重视以研究挑战和数据集推进能力验证。
DSRI提到正在开发并开源多种原型工具:DSID用于持续生成封存测试场景,Dyff用于在AI更新和新增安全测试场景时进行敏捷评估,TryIt用于AI采用前的可用性和效用验证,SaferAtDay0则面向CI/CD中的实时扫描。文本未披露API、SDK、部署方式、成熟产品入口、免费额度或商业定价,因此更适合按研究工具和评测框架理解,而非即买即用的SaaS。
优点是定位清晰,关注AI公共风险而非单点功能,覆盖多模态媒体、内容安全、心理风险与网络安全,并提出从孵化、研究、工程到采用的完整管线。局限也明显:缺少具体模型、准确率、误报率、隐私条款、服务支持和中文能力信息;工具被称为prototype,实际稳定性和企业落地程度需要进一步验证。
它适合AI安全评测团队、学术研究者、认证组织、政府或大型企业的AI治理部门,以及希望在开发流程中加入安全扫描的工程团队。对普通个人用户或需要开箱即用内容审核API的团队,可能门槛较高。中国访问、网络连通性、支付方式和本地替代品信息在抓取文本中未说明,建议实际访问验证;若无法稳定访问,可考虑本地化内容安全、深度伪造检测或代码安全扫描工具作为替代方向。
本测评基于公开资料整理,不构成购买建议,请以 dsri.org 官网实际信息为准。
UL旗下AI安全评测资源,值得关注。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。