化学指纹检索库
各维度得分依据公开资料与字段推算,加权后即综合评分,仅供参考。
chemfp 是一个面向二进制化学信息学指纹的 Python 包和命令行工具集,定位非常垂直:帮助研究人员和开发者在 Python 环境中高效生成、读取、转换、搜索和分析分子指纹。它的核心卖点是高性能相似性搜索,并扩展到 Butina 聚类、球排除、定向球排除、MaxMin 多样性选择和全量相似度矩阵生成。
从功能看,chemfp 覆盖了从文件格式到算法再到工程集成的完整链路。它支持 FPS 文本格式、FPB 高性能二进制格式和 FPC 稀疏计数指纹格式;FPB 可通过内存映射实现快速打开,适合大型数据集和 Web 服务重启频繁的场景。工具层面同时提供 Unix 风格命令行和完整 Python API,可用于脚本、Django 服务、Jupyter 组件或 PyQt 桌面应用。
生态兼容性是其另一大优势。chemfp 支持 RDKit、OEChem/OEGraphSim、CDK、Open Babel、jCompoundMapper,并提供跨工具包 Toolkit API 与 Text Toolkit API,用于统一分子 I/O、格式发现、错误处理和 SDF/SMILES 文本记录处理。它还与 NumPy、SciPy、Pandas 集成,可输出 SciPy 稀疏矩阵、NumPy 数组或供 scikit-learn 使用的全量矩阵。
当前主线版本并非完全开源。官方描述了无限源码许可证:购买后可获得除许可证管理器外的完整源码和一年支持,支持期内包含新版本更新;也有续订支持、限时授权和仅二进制授权。预编译 Linux 包可安装,但部分功能受限或禁用,需要申请评估密钥。旧的 chemfp 1.6.1 为免费/开源版本,但仅支持 Python 2.7,更适合作为基准或遗留系统用途。
优点是性能强、API 和命令行兼备、文档极其详尽,并且对多种化学工具包的统一封装能显著降低跨工具链成本。缺点是商业价格未披露,现代版本授权门槛较高;同时它不能在没有第三方化学工具包时从结构文件生成指纹,且应用范围集中在化学信息学。
抓取文本未提供中国大陆访问、支付方式或镜像信息,因此访问状态评为未知。若网络或采购受限,可评估 RDKit 自带功能、Open Babel、CDK、OEChem/OEGraphSim,或基于 NumPy/SciPy/scikit-learn 自建流程,但在大规模指纹搜索和统一工具包封装方面可能需要更多工程投入。
本测评基于公开资料整理,不构成购买建议,请以 chemfp.com 官网实际信息为准。
高性能化学指纹搜索工具,开发者可用。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。