海外资源测评导航
返回网络安全 海外资源 / 网络安全 / PII脱敏/开源CLI / scrubfile.com
S
🛡 网络安全 PII脱敏/开源CLI 未知总部 国内优化

scrubfile.com

本地文件隐私脱敏

8.0/10 中国可用
TTG4G 编辑组 ·更新于 2026-06-08 ·数据来源: ai_crawl 评测方法 ↗
数据来源
ai_crawl · 最近更新 2026-06-08
行业深度解析AI 深度分析
一句话本地运行的开源 PII 文档脱敏/永久擦除工具,当前重点支持 PDF,规划支持图片、DOCX、自动识别和 MCP。
定价免费/开源 页面显示 Free,可通过 pip/GitHub 安装;未提供商业版、订阅或托管服务定价。需注意其依赖 PyMuPDF 为 AGPL-3.0,公开分发时可能带来许可证合规要求。
适合谁需要在本机离线处理含个人身份信息文档的开发者、安全/合规团队、数据处理自动化场景;更适合处理可信本地文件。
核心功能本地运行,无云 API,运行时无网络调用PDF 敏感信息永久擦除,不是视觉遮罩CLI 与 Python APIJSON 机器可读输出PII 输出脱敏,日志中不回显原始敏感词PDF 元数据清理SSN 和美国电话号码格式变体自动扩展输出文件权限设置为 0o600规划支持图片、DOCX、OCR、自动 PII 检测、MCP Server
防护类型PII/个人身份信息脱敏与文档永久擦除;当前详细文档重点为 PDF 文本层敏感词擦除和元数据清理。
部署方式本地部署/本机运行;通过 pip、GitHub 源码安装,提供 CLI 与 Python API;运行时无网络调用。MCP Server、OCR、多格式能力在路线图中。
定价免费/开源;未披露商业定价。
适用规模适合个人开发者、小团队、自动化脚本和本地合规处理流程;文本明确说明面向可信本地使用,未针对互联网不可信输入加固。
管理与告警提供 CLI 退出码、JSON 输出、脱敏统计、受影响页数、错误状态;无集中管理台、策略编排或告警系统信息。
集成能力CLI、Python API、JSON 输出;规划 MCP Server 供 Claude、Cursor 等 AI Agent 调用;可与脚本、CI/CD 或本地数据处理流水线集成。
中国访问未知
适用场景PDF 合同、员工记录、报告、客户资料在共享或归档前脱敏;CI/CD 或批处理流程中的本地文档清洗;AI Agent 或自动化系统调用前对文件进行 PII 去除。
同类Adobe AcrobatGoogle DLPPresidio;中国本地可结合 WPS/福昕 PDF 工具、企业 DLP/数据脱敏平台或自建 Presidio/OCR 流水线替代。
性价比8
易用7
服务5
综合7
优点
  • 隐私友好,强调本地处理和零运行时网络调用
  • PDF 擦除采用内容流删除,安全性优于简单覆盖黑框
  • CLI、JSON、Python API 适合脚本化和自动化集成
  • 对日志泄露风险有考虑,JSON 输出不回显 PII
  • 提供文件大小限制、符号链接检查、输出权限限制等基础安全控制
不足
  • 当前正文中的详细文档显示 Phase 1 仅接受 PDF,图片、DOCX、OCR 和自动检测仍为规划;与首页多格式/自动检测描述存在阶段差异
  • 不支持扫描版 PDF 或 PDF 内嵌图片中的文字识别
  • 主要依赖精确字符串匹配,姓名、邮箱、地址等缺少模糊匹配
  • 初期非英文 PII 检测未覆盖
  • 不适合处理来自互联网的不可信输入

深度测评

TG4G · 2026-06-08 更新 · 仅供参考

是什么

scrubfile 是一个面向个人身份信息(PII)清理的本地文档擦除工具。页面强调“100% Local”、无云 API、运行时无网络调用,并支持 CLI、Python API 与 JSON 输出。需要注意的是,首页称支持 PDF、图片、DOCX 与自动检测 PII,但详细文档又说明 Phase 1 仅支持 PDF 显式敏感词擦除,图片、DOCX、OCR、自动检测和 MCP Server 处于规划阶段,因此当前可验证能力应以 PDF 为主。

核心能力与安全性

在防护类型上,它不是传统网关或终端安全产品,而是文档级数据脱敏工具。PDF 处理采用 PyMuPDF 搜索文本位置、添加 redaction annotation 并执行 apply_redactions,从内容流中删除文本,而非简单覆盖黑框;同时清理标准与 XMP 元数据,并以 garbage=3、deflate 保存。它还会把输出文件权限设为 0o600,并在 CLI/JSON 中用 [TERM-1] 形式隐藏原始 PII,降低日志泄露风险。SSN 与美国电话号码支持常见格式变体扩展,但姓名、邮箱、地址仍以精确匹配为主。

部署、集成与管理

部署方式偏开发者友好:本地 Python 3.10+ 环境,通过 pip/GitHub 安装,提供 scrubfile 命令、Python redact() API 和机器可读 JSON 输出。管理与告警能力较轻量,主要是退出码、处理状态、脱敏次数、影响页数等结果,不具备集中策略管理、审计平台或告警联动。集成上适合脚本、批处理、CI/CD 或本地数据处理流水线;MCP Server 虽被宣传为 Agent-ready,但在路线图中仍显示为计划。

定价与合规

定价方面页面显示 Free,未披露商业版本或付费支持。合规认证未见说明。值得关注的是其依赖 PyMuPDF,文档标注 AGPL-3.0 许可证;私有本地使用不受限制,但若分发工具、二进制或网络服务,需要评估开源许可证合规风险。

优缺点与适合谁

优点是隐私边界清晰、运行离线、输出不回显敏感词,且 PDF 内容流永久删除比视觉遮盖更可靠。缺点是目前对扫描件、图片内文字、模糊匹配、非英文 PII 识别和互联网不可信输入处理支持有限。它更适合安全团队、法务/HR、数据工程师在本机批量清理 PDF;若需要企业级 DLP、中文 OCR、集中审计和策略治理,仍需考虑 Adobe Acrobat、Google DLP、Presidio 或中国本地 PDF/DLP/数据脱敏方案。中国访问与支付信息未披露,GitHub/PyPI 可用性可能受网络环境影响。

本测评基于公开资料整理,不构成购买建议,请以 scrubfile.com 官网实际信息为准。

中文卖点

本地运行脱敏PDF、图片、DOCX,适合隐私合规场景。

官网快照

/shot/scrubfile-com.png
scrubfile.com

价格走势

当前价 · 仅供参考
$240.00 / 月 当前月费 (美元)
价格采集自官网公开页面,实时更新;历史走势数据采集中,暂无足够历史样本。下单请以官网实时价为准。

用户评价

综合评分
8.0/10
TG4G 综合评分

评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。

常见问题

scrubfile.com 是一家未知的网络安全 (PII脱敏/开源CLI)服务商. 本页收录其「本地文件隐私脱敏」套餐. 本地运行脱敏PDF、图片、DOCX,适合隐私合规场景.
scrubfile.com 最低月费 $240.00. 实际价格以官网为准.
scrubfile.com 在中国大陆有较好的直连体验, 多数地区无需代理即可访问. 该商家总部位于未知, 主要面向海外市场.
访问 scrubfile.com 官网完成注册即可使用. 注册一般需要邮箱 (推荐 Gmail/Outlook) 和支付方式. 多数海外服务支持信用卡 / PayPal / 加密货币. 完整流程见本页"前往官网"按钮.

浏览其他大类