海外资源测评导航

tg4g海外资源测评导航

返回AI 应用海外资源 / AI 应用 / AI基准评测 / remotelabor.ai

🤖 AI 应用 AI基准评测美国总部国内优化

remotelabor.ai AI 应用测评

Name: remotelabor.ai - 衡量远程工作AI替代
Brand: remotelabor.ai
Rating: 7.0 (1 reviews)

衡量远程工作AI替代

7.0/10 中国可用

TTG4G 编辑组 ·更新于 2026-06-18 ·数据来源: ai_deepen 评测方法 ↗

数据来源

ai_deepen · 最近更新 2026-06-18

⚡ 评分构成

五维加权 · 满分 10

性能 / 功能25% 7.0

性价比20% 7.0

中国可用度20% 10.0

口碑20% 6.0

售后 / 退款15% 6.5

各维度得分依据公开资料与字段推算,加权后即综合评分,仅供参考。

行业深度解析AI 深度分析

一句话用于量化前沿AI代理真实远程工作自动化能力的学术基准平台

定价免费暂未提供付费服务，所有基准资源、论文、代码均对公众开放

适合谁AI研究人员、AI开发团队、政策制定者、劳动经济研究者

核心功能多行业远程工作真实项目基准基于人类专业人员实际交付的成本与工时标注端到端AI代理自动化能力评估可量化追踪AI在复杂劳动任务上的进展代码开源，支持复现与扩展

AI能力与模型RLI本身不是AI模型，而是用于评估前沿AI Agent框架的基准。它衡量模型/Agent在真实远程工作项目上的端到端自动化率，正文指出当前最先进系统在RLI上表现接近地板水平，最佳模型自动化率仍然很低。

典型用例用于测量AI对远程劳动的自动化能力，覆盖游戏开发、产品设计、建筑、数据分析、视频动画等真实项目；也可用于跟踪AI Agent能力进展并支持劳动力自动化影响研究。

API与集成正文提供论文、GitHub代码入口、X公告和 dashboard.safe.ai 的最新结果入口，但未说明API、SDK或企业集成能力。

输出质量与局限评估结论显示，当前前沿AI Agent仍远不能自动化真实远程工作项目，绝大多数项目无法达到可被委托方接受的质量；但模型能力在稳步提升，且复杂任务上的进展可被测量。

支付['无']

中国访问可直连

国内可用性🔎 查任意海外服务在中国能不能用 →

适用场景['AI代理自动化能力的学术研究与性能验证''AI劳动自动化进展的长期追踪与对比''AI对就业影响的政策研究与实证分析''AI开发团队的产品迭代与性能优化参考']

同类SWE-bench、GAIA、OSWorld、WebArena、Humanity's Last Exam、METR相关AI能力评估

性价比7

易用6

服务5

综合7

优点

采用真实付费远程工作项目，测试场景贴近实际商业需求
覆盖游戏开发、产品设计、建筑、数据分析、视频动画等多个行业
项目数据来源可靠，均来自真实人类交付记录，总工作量超6000小时、总价值超14万美元
填补了现有AI基准与真实经济价值之间的评估空白
项目开源，支持研究人员复现、扩展测试集

不足

当前仅提供评估框架，无内置AI代理工具
自动化率排行榜数据需跳转至外部平台查看
未提供面向普通用户的测试入口，使用门槛较高
暂未提供项目下载或批量测试接口

深度测评

TG4G · 2026-06-18 更新 · 仅供参考

产品概述

Remote Labor Index（简称RLI）是由Center for AI Safety与Scale AI联合推出的学术研究型基准平台，核心目标是量化前沿AI代理在真实远程工作场景中的自动化能力。与传统聚焦知识推理的AI基准不同，RLI的测试集全部来自人类专业人员实际交付的商业远程项目，旨在填补AI技术进展与真实经济价值转化之间的评估空白，为AI劳动自动化的讨论提供实证依据。

核心功能

RLI的核心是一套覆盖多行业的真实远程工作项目基准库，涵盖游戏开发、产品设计、建筑、数据分析、视频动画等多个远程工作主流领域。所有项目均附带人类交付时的真实数据：单项目成本最高超过10000美元，单项目完成最长超过100小时，整个测试集累计超过6000小时的真实工作量，总商业价值超过14万美元，复杂度和成本与真实自由职业市场完全对齐。平台支持对端到端AI代理的完整任务执行能力进行评估，可量化追踪不同模型在复杂商业任务上的进展。

定价与访问

目前RLI完全免费对外开放，官方提供了完整论文、GitHub开源代码、X平台发布公告等资源，无需付费即可获取基准相关的全部学术资料，暂未推出任何付费服务或功能。中国大陆用户无需使用代理即可正常访问remotelabor.ai的首页内容。

优缺点

优势

测试场景高度贴近真实商业需求，全部项目来自实际付费委托，评估结果更具现实参考价值；
覆盖多个主流远程工作行业，项目难度跨度大，可全面评估AI代理的综合能力；
所有项目的成本、工时数据均来自人类实际交付记录，数据可信度高；
研究框架完全开源，支持全球研究人员复现测试结果、扩展测试集。

不足

当前仅提供评估基准框架，本身不内置AI代理工具，用户需自行接入模型进行测试；
首页未展示完整的自动化率排行榜，需跳转至dashboard.safe.ai查看最新数据；
无面向普通用户的可视化测试入口，使用门槛较高，主要面向学术和专业研究人员；
暂未提供测试项目的一键下载或批量测试接口。

适合人群

RLI的核心受众是AI研究人员、AI技术开发团队、劳动经济研究者、政策制定者。对于需要验证AI代理实际落地能力、追踪AI劳动自动化进展、研究AI对就业的影响、优化AI产品性能的专业人士来说，RLI是极具价值的实证研究工具。

本测评基于公开资料整理,不构成购买建议,请以 remotelabor.ai 官网实际信息为准。

📢 订阅 TG4G 电报频道

每日精选海外资源 + 国内可用性速报 · 也可在 @amzseo_bot 直接搜

加入频道 →

中文卖点

学术研究型项目，可参考AI自动化趋势。

官网快照

/shot/remotelabor-ai.png

remotelabor.ai

快照生成中 · 后端每周自动抓取官网首页

价格走势

当前价 · 仅供参考

价格未公开当前定价

价格采集自官网公开页面,实时更新;历史走势数据采集中,暂无足够历史样本。下单请以官网实时价为准。

用户评价

综合评分

7.0/10

TG4G 综合评分

评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。

常见问题

remotelabor.ai 是一家美国的AI 应用 (AI基准评测)服务商. 本页收录其「衡量远程工作AI替代」套餐. 学术研究型项目，可参考AI自动化趋势.

remotelabor.ai 综合评分 7.0/10, 总部美国. 产品概述 Remote Labor Index（简称RLI）是由Center for AI Safety与Scale AI联合推出的学术研究型基准平台，核心目标是量化前沿AI代理在真实远程工作场景中的自动化能力。与传统聚焦知识推理的AI基准不同，RLI的测试集全部来自人类专业人员实际交付的商业远程项... 完整深度测评见本页下方.

remotelabor.ai 在中国大陆有较好的直连体验, 多数地区无需代理即可访问. 该商家总部位于美国, 主要面向海外市场.

访问 remotelabor.ai 官网完成注册即可使用. 注册一般需要邮箱 (推荐 Gmail/Outlook) 和支付方式. 多数海外服务支持信用卡 / PayPal / 加密货币. 完整流程见本页"前往官网"按钮.

浏览其他大类

🌾 农业食品 🔗 API 数据 🚪 API 网关 🧊 3D素材 🚗 汽车出行 🗃 备份容灾 📋 公司合规 📡 智能盒子 🧱 建站模板 🌐 CDN 💬 聊天 App ☁ 网盘云盘 📖 漫画网文 ✉ 通讯邮箱 🏢 跨国名企 💰 加密 🗄 托管数据库 🏷 比价优惠 🎨 设计创意 🔧 开发工具 📡 DNS 解析 🌍 域名 ⬇ 下载软件 🛒 电商 📚 教育课程 📧 邮件发送 ⚡ 能源环保 🎫 活动票务 🎪 会展展会 📤 文件传输 🏦 金融钱包 📝 表单调研 💭 论坛社区 💸 众筹融资 🎮 游戏服务 🎮 游戏市场 🕹 游戏平台 🎁 订阅礼品卡 🏛 政府机构 🎯 GPU 算力 🔌 硬件 IoT 🩺 医疗健康 👔 招聘远程 🖼 图片灵感 🛡 保险 💼 求职招聘 📒 知识笔记 ⚖ 法务财税 📍 本地生活 📦 物流货运 🔎 生活查询 🗺 地图导航 📈 营销 SEO 📺 流媒体订阅 🎞 家庭影音 📰 新闻资讯 🤝 公益慈善 📄 办公协作 🌍 国际组织 ☁ 应用部署 🎛 主机面板 🔑 密码安全 💳 支付 🐾 宠物 👕 印刷定制 🎙 播客有声 🔌 代理 ❓ 问答内容 🏠 房产租售 ⚡ 实时通信 🖥 远程桌面 🗂 资源站 ⚙ SaaS ♻ 二手交易 🛡 安全 📱 短视频直播 📲 接码虚拟号 💬 社交约会 🔐 SSL 证书 💾 云存储 🎓 留学教育 🎧 在线客服 🧰 在线工具 🌐 翻译本地化 ✈ 旅游出行 🏛 全球大学 🚀 加速器 VC ▶ 视频平台 🎬 视频托管 🔒 VPN 隐私 🖥 服务器 🌐 虚拟主机 🔏 零信任组网