Kubernetes 可观测性体系:监控、日志与链路追踪
Kubernetes 可观测性体系:监控、日志与链路追踪
1. 可观测性三大支柱
1 | |
2. Prometheus 监控体系
2.1 架构概览
1 | |
2.2 kube-prometheus-stack 部署
1 | |
2.3 ServiceMonitor(自动发现)
1 | |
2.4 关键 Kubernetes 监控指标
1 | |
2.5 告警规则
1 | |
2.6 Alertmanager 配置
1 | |
3. Grafana 仪表板
3.1 推荐仪表板
1 | |
3.2 自定义仪表板变量
1 | |
4. 日志体系
4.1 日志收集架构
1 | |
4.2 Fluent Bit 配置
1 | |
4.3 Loki(轻量级日志方案)
1 | |
5. 链路追踪(Distributed Tracing)
5.1 OpenTelemetry 标准
1 | |
5.2 Jaeger 部署
1 | |
5.3 OpenTelemetry Collector
1 | |
6. Kubernetes Events 监控
1 | |
1 | |
7. SLO/SLA 监控
1 | |
8. 可观测性最佳实践
8.1 USE 方法(资源监控)
1 | |
8.2 RED 方法(服务监控)
1 | |
8.3 四个黄金信号
1 | |
9. 总结
完整的 Kubernetes 可观测性体系:
- Metrics:Prometheus + Grafana,覆盖集群、节点、Pod、应用四个层次
- Logs:Fluent Bit + Loki/Elasticsearch,结构化日志 + 全文搜索
- Traces:OpenTelemetry + Jaeger,分布式请求链路追踪
- Alerts:Alertmanager 多渠道告警,基于 SLO 的告警策略
- Events:Kubernetes Events 监控,快速发现集群异常
可观测性不是事后补救,而是系统设计的一部分。
Kubernetes 可观测性体系:监控、日志与链路追踪
https://k8s.chucz.asia/Kubernetes可观测性体系/