本地追踪AI编程代理
各维度得分依据公开资料与字段推算,加权后即综合评分,仅供参考。
thirdeye 是一款面向 AI coding agents 的本地优先观测工具,核心定位是“Trace every agent session, locally”。它不提供云端 SaaS,而是把 trace、标签、评估结果和 token 使用数据存放在本机 ~/.thirdeye/,并通过 CLI 与本地 Browser UI 进行查询和分析。
从功能看,thirdeye 覆盖了 AI 代理会话审计的关键环节:可通过 thirdeye add 为 Claude Code、Cursor、OpenAI Codex CLI、Gemini CLI、GitHub Copilot CLI 注册 hook;随后用 list、events、tail、search 查看历史,用 tag 管理事件标签,用 usage 汇总 token 消耗。它还支持基于 rubric 的 eval run,可让 claude、codex、gemini 作为 LLM-as-judge 对会话进行评估。数据层面使用 JSONL sidecars 与 SQLite usage index,且读命令普遍支持 --json,适合脚本化处理。
正文没有披露任何付费计划或企业版价格。产品强调 No cloud、No SaaS、No telemetry,并提供 Homebrew、pipx、uv 安装方式。它天然属于本地部署形态,可通过 THIRDEYE_HOME 覆盖数据目录;Browser UI 默认运行在 127.0.0.1:8765,需要安装 UI extra。
优点是隐私友好、无需账号、无需改业务代码即可追踪支持的代理 CLI;命令体系细,文档列出了完整子命令、参数和示例,易于上手。缺点是正文只明确 Mac 和 Linux,未说明 Windows;覆盖面依赖已支持的代理;评估功能仍需要外部 LLM/代理可用;也没有看到团队协作、权限、共享看板或商业支持信息。
它适合重度使用 Claude Code、Cursor、Codex、Gemini 或 Copilot CLI 的个人开发者和小团队,用于复盘代理操作、排查误改、统计 token、沉淀评估规范。中国访问情况正文未说明;安装可能涉及 Homebrew、PyPI、GitHub 以及相关代理服务,网络与模型服务可用性需自行验证。若需要云端团队观测,可对比 Langfuse、Helicone、Arize Phoenix 等方案。
本测评基于公开资料整理,不构成购买建议,请以 third3y3.com 官网实际信息为准。
本地优先AI代理追踪工具,开发者价值高。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。