提取未知二进制文件
unblob 是由 ONEKEY 开发并维护的开源提取套件,目标是“extract everything”。它面向未知二进制 blob、固件镜像等复杂输入,能够解析 30 多种归档、压缩和文件系统格式,递归提取内容,并对未识别的数据块进行 carving。它既提供命令行界面,也可作为 Python library 使用,定位明显偏向嵌入式安全、固件分析和逆向工程。
unblob 的核心优势在于准确识别 chunk 的起止偏移。它通过搜索规则定位起始偏移,再按格式标准计算结束偏移,并校验 header、丢弃重叠 chunk,以降低误报。对 null padding、0xFF padding 等已知填充内容也能自动识别和报告。提取后,工具会继续遍历已解包文件,实现递归分析,并可生成包含格式、偏移、大小、熵、权限、时间戳等信息的元数据报告。
项目主体使用 Python 编写,CPU 密集型任务如熵计算使用 Rust 加速;二进制模式搜索使用 Hyperscan,ELF 分析使用 LIEF,CLI 使用 Click,日志使用 structlog。其 API 设计较适合二次开发:开发者可扩展 Handler、DirectoryHandler、Extractor、DirectoryExtractor,实现自定义格式识别、多文件集合处理和提取逻辑。
unblob 明确为免费使用,采用宽松的 MIT License,商业和内部安全团队都可较低成本集成。文本未提及付费版本、商业托管或 SLA。
优点是开源、准确性目标明确、支持递归提取、多进程和内存映射提升速度,并强调安全:无需高权限运行,经过大量测试和 fuzzing,且审计过部分第三方 extractor。缺点是它主要服务专业开发者和安全研究者,命令行、外部依赖及自定义 handler 开发都有一定门槛。适合固件安全、逆向、数据恢复、内存取证和恶意软件分析团队。
抓取文本未提供中国大陆访问、镜像或下载可用性信息,china_access 只能判定为未知。若 GitHub 访问不稳定,可考虑在可达环境下载源码和依赖;替代工具可关注 binwalk、firmware-mod-kit、foremost 等。
本测评基于公开资料整理,不构成购买建议,请以 unblob.org 官网实际信息为准。
开源固件/二进制分析工具,安全研究有用。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。