分布式系统事件监控
各维度得分依据公开资料与字段推算,加权后即综合评分,仅供参考。
Riemann 是一个面向分布式系统的网络监控与事件聚合系统。它接收服务器和应用主动推送的事件,通过流处理语言进行过滤、聚合、告警和转发。与传统定时轮询监控相比,页面强调 Riemann 能在毫秒级让事件可见,从而更快发现故障和验证修复效果。
其核心是“stream primitives”:事件是带有 host、service 等字段的结构,stream 本质上是接收事件的函数。用户可以用内置 stream 过滤、修改、组合事件,也可以编写自己的逻辑。配置本身是 Clojure 程序,因此表达力很强,适合复杂生产环境中的异常、延迟、状态变化、集群统计等规则编排。Riemann 还提供状态查询语言,查询结果可用于客户端监控、报表或实时 Dashboard。
Riemann 使用 Protocol Buffers over TCP/UDP 作为紧凑、可移植的通信协议。页面展示了 Ruby client 发送事件与查询状态的示例,并有 Clojure API、Clients 等文档入口。集成方面,它可将事件流转发到 Graphite,内置 Librato Metrics 集成,并支持 email 告警,也可结合 PagerDuty 实现短信或电话告警。Dashboard 方面,页面提到小型可扩展 Sinatra 应用和基于 WebSocket 的实时看板。
正文未出现商业订阅或收费计划。页面提供 Riemann 0.3.11 下载,并强调开源贡献者,因此可判断其主要形态是开源自托管。它适合愿意自行部署、维护和编写监控规则的团队,而不是追求 SaaS 开箱即用的用户。
优点是低延迟、配置即代码、扩展性强,并能承载复杂事件处理;页面还声称普通 x86 硬件在默认配置下可达到很高吞吐。缺点是 Clojure 配置有学习门槛,现代可观测平台常见的日志、Tracing、云托管、权限管理、SLA 等能力在正文中没有体现。它更适合运维、SRE、平台工程和后端团队,用于构建自定义监控与告警管道。
未抓取到中国大陆访问、镜像、支付或本地支持信息,访问情况记为未知。若需要替代品,可考虑 Prometheus、Grafana、Graphite、Zabbix、Nagios,或商业化的 Datadog、New Relic 等。
本测评基于公开资料整理,不构成购买建议,请以 riemann.io 官网实际信息为准。
开源监控系统,可用于服务器与应用事件聚合。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。