一句话一个持久化用户模型工具,用于预测用户可能输入的内容,让 AI Agent 在低风险场景下减少打扰人类。
适合谁AI Agent 开发者、自动化工具开发者、MCP 客户端用户、自托管技术团队、需要基于个人历史行为进行回复预测的用户
核心功能基于 Recording → Memory → Prediction 三层架构构建持久用户模型通过 POST /api/predictions/predict/ 返回候选回复、置信度与 auto/escalated 状态支持 MCP Server,可接入 Claude Code、Cursor、Claude Desktop 等 MCP-aware 客户端支持事件幂等写入,便于生产端重试提供四层记忆存储:UserProfile、SemanticMemory、EpisodicMemory、RawMemory支持自托管,docker-compose 可启动 Postgres、Django API、MCP server 与 Web 容器提供 TypeScript 与 JSON Schema 的 CloneEvent 契约
AI能力与模型Clone 的核心能力是构建持久化用户模型,预测用户面对 Agent 提示时可能输入的内容。系统使用 Recording、Memory、Prediction 三层架构:记录用户事件,将其蒸馏为多级记忆,再调用 Anthropic 生成 top-K 候选回复,并返回校准置信度、原始置信度以及 auto/escalated 状态。
典型用例适用于 AI Agent 在执行任务时预测用户意图、减少频繁确认;为 Claude Code、Cursor、Claude Desktop 等 MCP 客户端提供 predict_next_prompt;也可用于自动回复、输入续写、Agent 会话记录、个人语义记忆管理和自托管用户模型。
API与集成提供 REST API,核心接口为 POST /api/predictions/predict/,其余为支持性 CRUD。支持 API Key 鉴权示例。MCP Server 提供 7 个工具:predict_next_prompt、predict_continuation、submit_feedback、start_session、stop_session、record_agent_prompt、record_agent_response,支持 stdio 和 Stream
数据隐私正文说明所有事件会进入 Recording 层,并在用户自身数据上进行 LLM 驱动的记忆提升;支持自托管部署。但未披露数据加密、保留周期、权限隔离、合规认证或第三方模型调用时的数据处理政策。
输出质量与局限输出包含候选回复、校准置信度和自动/升级状态,支持基于阈值的自动化。系统会通过 accepted/rejected/edited 反馈进行每日校准,并对记忆重要性进行行为衰减更新。局限在于冷启动预测置信度仅约 0.3–0.5,需要积累真实历史;准确性依赖记录数据质量和 Anthropic 调用。
中国访问未知
适用场景AI Agent 自动判断用户下一步回复、代码助手减少确认打断、基于用户历史偏好的自动回复、个人行为记忆层、自托管 Agent 记忆与预测服务、MCP 客户端上下文增强
同类OpenAI Assistants/Responses API、LangGraph、Mem0、Zep、Letta、Dify、Coze