开发者AI工具博客
demos-not-memos 是 Mark Ng 围绕 AI 编码代理验收流程构建的开发者工具。它的核心观点是:当 Claude Code、Codex 等 agent 声称“已完成实现”时,开发者仍然要阅读 diff、追踪逻辑、手动点击 UI 来确认功能是否真的符合预期。该工具试图让 agent 直接“演示自己做了什么”,用浏览器操作加同步旁白来闭环验证。
正文显示,该项目是一个构建在 Playwright 之上的 TypeScript DSL,并以 npm package demos-not-memos 提供。示例中可以创建 NarratedDemo,设置 baseUrl、语音和视频输出路径,然后调用 start、narrate、Playwright locator 操作和 finish,生成带旁白的浏览器演示。作者还将其封装为 Claude Code skill/plugin,名为 narrated-demo。
支持范围方面,文本明确提到 Claude Code,并在更新中说明可与 OpenAI Codex 配合使用。由于 npm 包只是 TypeScript 和 Playwright、没有 Claude 专属依赖,理论上也能被其他 AI coding tools 调用。不过,正文未说明对非 Web UI、移动端、后端 API 或 CLI 场景的支持。
抓取内容没有提供定价、付款方式、许可证、是否开源、自托管或企业支持信息。它以 npm 包和 Claude Code plugin 形式出现,说明安装和集成路径偏开发者友好;但缺少完整文档、版本兼容性、安全模型和维护承诺,仍更像早期个人工具。
它的优点是切中 AI 编码的真实痛点:减少“代理写代码、人工做 QA”的割裂,让代码审查更聚焦质量而不是意图是否被理解。基于 Playwright 也便于开发者理解和扩展。缺点是信息披露有限,成熟度、稳定性和长期维护都未知;且价值主要集中在有浏览器 UI 的功能验证。
适合经常使用 Claude Code、Codex 构建 Web 原型或前端功能的个人开发者和小团队,用来生成验收演示或快速发现需求误解。对强合规、需要 SLA 的企业团队,目前资料不足。
正文未提供中国大陆访问、镜像、支付或网络可用性信息,因此判断为未知。可替代或互补工具包括 Playwright、Cypress、Selenium,以及 Claude Code、OpenAI Codex 自身的测试/演示能力。
本测评基于公开资料整理,不构成购买建议,请以 markng.co.uk 官网实际信息为准。
有Claude工作流实践,适合开发者借鉴。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。