衡量远程工作AI替代
各维度得分依据公开资料与字段推算,加权后即综合评分,仅供参考。
Remote Labor Index(简称RLI)是由Center for AI Safety与Scale AI联合推出的学术研究型基准平台,核心目标是量化前沿AI代理在真实远程工作场景中的自动化能力。与传统聚焦知识推理的AI基准不同,RLI的测试集全部来自人类专业人员实际交付的商业远程项目,旨在填补AI技术进展与真实经济价值转化之间的评估空白,为AI劳动自动化的讨论提供实证依据。
RLI的核心是一套覆盖多行业的真实远程工作项目基准库,涵盖游戏开发、产品设计、建筑、数据分析、视频动画等多个远程工作主流领域。所有项目均附带人类交付时的真实数据:单项目成本最高超过10000美元,单项目完成最长超过100小时,整个测试集累计超过6000小时的真实工作量,总商业价值超过14万美元,复杂度和成本与真实自由职业市场完全对齐。平台支持对端到端AI代理的完整任务执行能力进行评估,可量化追踪不同模型在复杂商业任务上的进展。
目前RLI完全免费对外开放,官方提供了完整论文、GitHub开源代码、X平台发布公告等资源,无需付费即可获取基准相关的全部学术资料,暂未推出任何付费服务或功能。中国大陆用户无需使用代理即可正常访问remotelabor.ai的首页内容。
RLI的核心受众是AI研究人员、AI技术开发团队、劳动经济研究者、政策制定者。对于需要验证AI代理实际落地能力、追踪AI劳动自动化进展、研究AI对就业的影响、优化AI产品性能的专业人士来说,RLI是极具价值的实证研究工具。
本测评基于公开资料整理,不构成购买建议,请以 remotelabor.ai 官网实际信息为准。
学术研究型项目,可参考AI自动化趋势。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。