K8s空闲缩容到零
KubeElasti 是一个 CNCF Sandbox 项目,定位为 Kubernetes 原生的 HTTP 服务 scale-to-zero Operator。它的核心目标是在服务空闲时把副本数降到 0 以节省成本,并在流量到来时自动恢复到最小副本,同时通过代理队列避免请求丢失。项目最初由 TrueFoundry 创建,并在 GitHub 上开放开发。
KubeElasti 通过 ElastiService 这个 CRD 接入现有 Service,并引用 Deployment、StatefulSet 或 Argo Rollouts 作为扩缩容目标。它持续评估 Prometheus 查询和阈值等触发条件;当满足空闲条件时进入 Proxy Mode,将副本缩到 0 并由 resolver 接收、排队请求;当出现有效请求或触发器需要恢复时,将服务扩到 minTargetReplicas,并进入 Serve Mode,让流量重新直达 Pod。它还可在 0 副本时直接响应健康检查,避免负载均衡探针触发无意义唤醒。
它并不试图替代 HPA 或 KEDA,而是负责 0↔1 的阶段,1 到 N 仍交给 HPA/KEDA 处理。正文还提到可选 KEDA pause,避免 ScaledObject 与空闲缩容产生冲突。观测方面,KubeElasti 导出 Prometheus 指标,并可通过 ServiceMonitor 接入监控,还可导入 Grafana 仪表盘。
正文未提及商业定价或托管服务收费。作为 CNCF Sandbox 且开放 GitHub 协作的项目,它更像一个可自托管的开源基础设施组件。部署方式是安装到 Kubernetes 集群,并通过 YAML 创建 ElastiService。
优点是无需修改业务代码、与现有 Ingress/Service Mesh 兼容、可降低低频服务成本,并通过请求排队改善冷启动体验。限制也明显:它主要面向 HTTP 流量;依赖 Kubernetes、Prometheus 与 CRD 配置能力;scale-to-zero 天然存在唤醒延迟,阈值配置不当还可能带来抖动。适合平台工程、SRE 和云原生团队,用于内部工具、低频 API、测试环境和成本敏感微服务。
抓取内容未提供中国大陆访问、镜像、支付或商业支持信息,china_access 只能标为未知。替代方案可关注 KEDA、Knative,以及在不需要缩到 0 时使用 HPA。
本测评基于公开资料整理,不构成购买建议,请以 kubeelasti.dev 官网实际信息为准。
空闲服务缩到零,降低K8s成本。
评分明细(分布与用户短评)接入中。当前展示 TG4G 综合评分,数据源自公开测评与用户反馈。