开源RPA自动化工具
各维度得分依据公开资料与字段推算,加权后即综合评分,仅供参考。
Ui.Vision 是 a9t9 software GmbH 提供的开源 RPA、Web 自动化和桌面自动化工具。它以 Chrome、Edge、Firefox 浏览器扩展为入口,同时可在 Windows、macOS、Linux 上自动化桌面应用。其定位不是单纯录制浏览器脚本,而是把 Selenium 风格命令、视觉识别、OCR、CSV 数据驱动测试和 AI Computer Use 组合到一个本地运行的自动化环境中。
在功能与用途上,它覆盖浏览器自动化、桌面自动化、网页抓取、屏幕 OCR 抓取、UI 测试和文件上传下载自动化。命令体系重实现了重要 Selenium IDE 命令,支持 ID、Name、Link、CSS、XPath 等定位器,也支持 if/while/times/forEach 等流程控制、隐式等待、测试套件和报告。网站明确提到可导入 Selenium IDE 项目并导出 HTML,适合迁移旧用例。其命令行 API 可用于调度、Grid 或 CI 场景。AI 方面提供 Anthropic Claude Computer Use 集成。
Ui.Vision 明确为开源项目,许可证为 GNU AGPL 3.0,商业二次分发或深度集成需注意合规。其安全卖点是自动化流程本地运行,数据不离开机器;例外主要是 OCR 云服务,但企业版可购买本地 OCR Server,Windows 和 Mac 的 XModules 也已内置本地 OCR。生态方面,有 GitHub 源码、用户论坛、RPA/OCR/AI 论坛、用户手册、命令参考和示例宏,文档颗粒度较细。
免费版可个人和商业使用,但硬盘直存等能力有限,OCR 有每日配额。PRO 为 US$299 一次性购买,Enterprise 为 US$999 起,企业包和无限 Player 许可另行计价。本地 OCR Server 插件 US$1499。相比订阅制 RPA,它的一次性买断有成本优势;但高级支持、更新管理、本地 OCR 与大规模部署需要企业版。
优点是跨平台、开源、本地运行、Selenium 迁移友好,并且把 Web、桌面、OCR 和视觉测试放在同一工具中。缺点是命令式界面对非技术用户不算低门槛;AGPL 对商业场景有约束;免费版和 PRO/Enterprise 的能力边界需要仔细核对。它适合测试工程师、开发者、企业 IT 自动化团队,以及需要本地化 RPA 而不想采用订阅制大型 RPA 平台的用户。
抓取文本未提供中国大陆访问、镜像或本地支付的明确说明。支付渠道提到信用卡、电汇、PO,以及按地区可能支持 Alipay。由于 AI 集成涉及 Anthropic Claude,相关能力在中国大陆的可用性可能受网络与服务限制影响。替代品可关注 Selenium IDE、Playwright、Robot Framework、Power Automate Desktop、UiPath 或 AutoHotkey。
本测评基于公开资料整理,不构成购买建议,请以 ui.vision 官网实际信息为准。
支持OCR、网页与桌面自动化,价值高。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。