事故转运行手册工具
plsfix 定位为“Issue Brain for platform engineering”,核心目标是避免团队反复解决同一类生产事故。它会从 Slack、PagerDuty、GitHub、Jira、Linear、ServiceNow、Notion、Claude/ChatGPT 等工具中只读摄取已解决事件,将分散在聊天、告警、PR、工单和 AI 对话里的诊断与修复过程聚合起来,识别重复事故模式,并生成可验证、可执行的 Runbook。
产品流程分为 Ingest、Cluster、Verify、Execute。Ingest 阶段默认只读,并在聚类或 LLM 调用前进行 PII 脱敏;Cluster 会学习告警 payload 正则、服务范围、部署接近性、频道和报告人模式等“事故签名”;Verify 阶段由工程师审核自动草拟的 Runbook,每一步都有来源追溯;Execute 阶段可将 Runbook 编译为 skill,低风险步骤自动执行,有影响面的操作则要求指定审批人。触发入口包括 Slack、CLI、PagerDuty、Linear/Jira 和 Web inbox。
目前公开信息显示 plsfix 仍是 closed pilot,面向少量 fintech 与平台团队做 6 周试点。接入方式为只读摄取,约 30 分钟搭建,第一周共同评审 cluster;若第 4 周未将重复事故量降低 30%,则无需付费。正式定价、付款方式和标准套餐未披露。
优点是设计上克制:它强调“不从 prompt 生成修复”,而是从团队已解决事故中提炼,配合 provenance、审批门禁、审计日志、SIEM 导出、90 天原始数据与 18 个月脱敏数据保留策略,适合高合规场景。缺点是产品成熟度和可获得性仍有限,是否开源、正式 API/SDK、完整部署文档均未说明;实际效果也高度依赖历史事故记录是否完整、工具链是否接入充分。
它更适合已有较多重复事故、On-call 压力大、工具链分散的平台工程、SRE 和金融科技团队。中国访问情况未知;其依赖的 Slack、PagerDuty、GitHub、Claude/ChatGPT 等生态在国内可能存在网络或合规阻力。国内团队可评估 PagerDuty Runbook Automation、Rundeck、FireHydrant、Rootly、incident.io,或基于自有工单/IM/监控系统构建类似 Runbook 自动化。
本测评基于公开资料整理,不构成购买建议,请以 plsfix.co 官网实际信息为准。
连接Slack/PagerDuty/GitHub,偏SRE自动化。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。