预测研究数据集仓库
各维度得分依据公开资料与字段推算,加权后即综合评分,仅供参考。
Monash Time Series Forecasting Repository(莫纳什时间序列预测仓库)是由澳大利亚莫纳什大学推出的全球首个面向全局预测模型评估的关联时间序列专用数据集仓库,目前已被NeurIPS 2021数据集与基准赛道正式收录,所有资源仅面向非商业研究用途开放。该仓库的核心目标是解决时间序列预测研究中数据集标准不统一、跨领域评测成本高的痛点,为全球研究者提供标准化的基准测试支撑。
当前仓库共收录30组核心时间序列数据集,衍生出按采样频率、是否包含缺失值划分的58个版本,覆盖能源、旅游、金融、交通、医疗、自然科学等10余个垂直领域,同时包含M1/M3/M4等经典竞赛数据集、公开权威数据集以及莫纳什团队自制的真实场景数据集。所有数据采用自研的.tsf格式存储,基于sktime的.ts格式拓展而来,站点官方提供了R和Python的加载封装工具,可直接对接主流数据分析环境。
官方还完成了全量数据集的基准评测:共覆盖13种主流预测算法,包括Simple Exponential Smoothing、ARIMA、ETS等6种传统单变量模型,以及7种全局预测模型,所有评测结果可直接在站点查阅,为研究者省去了大量基础测试工作。
该仓库的所有数据集、评测结果、工具代码均完全免费开放,无任何访问费用或订阅门槛。用户使用时仅需遵守非商业研究约定,并引用官方2021年发表的NeurIPS论文作为标注即可。
该仓库的核心优势非常突出:一是数据集的全面性和标准化程度高,覆盖了从高频秒级到低频年度的各类采样场景,同时提供带缺失值和无缺失值双版本,适配不同研究需求;二是配套资源完善,从数据加载工具到基准评测结果均已齐备,大幅降低研究前期的准备成本;三是学术认可度高,已经成为时间序列预测领域的通用基准资源。
其局限性也较为明显:首先采用了自研的.tsf格式,需要适配官方工具才能高效使用,无法直接兼容通用数据格式;其次所有资源仅支持非商业用途,无法应用于企业商业项目;另外未提供在线可视化、在线计算等配套功能,所有数据处理均需要在本地完成。
该平台非常适合时间序列研究人员、AI预测算法开发者、高校相关专业师生使用,可直接用于模型性能验证、学术研究基准测试、算法训练调优等场景。中国境内用户可直接直连访问该站点,无需使用代理工具即可下载所有数据集和相关资源。
本测评基于公开资料整理,不构成购买建议,请以 forecastingdata.org 官网实际信息为准。
Monash时间序列数据集,适合AI/预测研究。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。