材料科学开放数据库
Starrydata是一个面向无机材料科学实验数据的开放数据库构建项目,目标是把论文图表中沉淀的大量实验数据数字化,用于Materials Informatics(MI)研究。它并非单一工具,而是由Starrydata2 Web系统、StarryDigitizer和Starrydata Explorer等组成的数据收集与浏览体系。
其核心方法是从论文中的图表图像提取数值数据,并且不是只采单个点,而是尽量采集整条曲线,以保留更多信息。覆盖领域包括热电材料、磁石材料、压电材料、准晶相关物质、热导率材料、固体物性和电池材料等。系统支持输入DOI后自动获取书目信息,生成原论文链接和数据录入页面;图表数据点可通过独自开发的StarryDigitizer检测或人工点击,单位会在注册时转换为统一SI单位。文本还提到正在引入GPT等外部AI辅助试料信息输入。
官网明确称,Starrydata相关系统在引用其论文的前提下,商业和非商业用途均可免费使用。若只是使用现有数据做研究,一般无需联系团队。但若委托Starrydata团队开展新的数据收集或共同研究,则需承担专属数据收集者人力成本,FAQ给出的量级至少为数百万円,并需向NIMS支付30%间接经费。项目不接受企业对共同研究采集的论文数据进行独占使用。
优点是数据来源清晰、开放复用、面向材料MI场景非常专业,并且承认论文理解仍需人工专业判断,自动化与人工互补的路线务实。缺点也明显:数据采集扩张依赖人力;委托采集成本不低;抓取文本未提供API、SDK、批量下载或自托管信息;网站主要为日文,对国际开发者和中国用户有语言门槛。
它适合材料科学研究者、材料企业研发团队、希望构建公开文献实验数据集的MI团队,不太适合作为通用开发者数据平台。中国访问情况文本未提及,判断为未知;支付方式也无信息。若需要替代或补充,可关注Materials Project、NOMAD、AFLOW、OQMD等材料数据平台,但数据类型与开放策略需分别核对。
本测评基于公开资料整理,不构成购买建议,请以 starrydata.org 官网实际信息为准。
无机材料实验数据开放库,科研与AI数据有价值。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。