目录 全书组织 Part I - Prometheus基础 第1章 天降奇兵 Prometheus简介 初识Prometheus 安装Prometheus Server 使用Node Exporter采集主机数据 使用PromQL查询监控数据 监控数据可视化 任务和实例 Prometheus核心组件 对比其它监控解决方案 小结 第2章 探索PromQL 理解时间序列 Metrics类型 Counter计数器 Gauges仪表盘 Histograms桶 Summaries概要 初识PromQL PromQL操作符 PromQL聚合操作 PromQL内置函数 在HTTP API中使用PromQL 最佳实践:4个黄金指标和USE方法 小结 第3章 Prometheus告警处理 Prometheus告警简介 自定义Prometheus告警规则 部署AlertManager Alertmanager配置概述 基于标签的告警处理路由 使用Receiver接收告警信息 集成邮件系统 集成Slack 集成微信 集成钉钉:基于Webhook的扩展 告警模板详解 屏蔽告警通知 使用Recoding Rules优化性能 小结 Part II - Prometheus进阶 第4章 Exporter详解 Exporter是什么 常用Exporter 容器监控:cAdvisor 监控MySQL运行状态:MySQLD Exporter 网络探测:Blackbox Exporter 使用Java自定义Exporter 使用client_java 在Spring Boot中集成 小结 第5章 数据与可视化 使用Console Template Grafana的基本概念 安装Grafana 使用Panel可视化监控数据 变化趋势:Graph面板 分布统计:Heatmap面板 当前状态:SingleStat面板 表格:Tabel面板 模板化Dashboard 共享Dashboard 小结 第6章 集群与高可用 本地存储 远程存储 联邦集群 Prometheus高可用 Alertmanager高可用 总结 第7章 Prometheus服务发现 Prometheus与服务发现 基于文件的服务发现 基于Consul的服务发现 自定义服务发现 服务发现与Relabel 小结 Part III - Prometheus实战 第8章 监控Kubernetes 初识Kubernetes 部署Prometheus Kubernetes下的服务发现 监控Kubernetes集群 使用Grafana创建可视化仪表盘 基于Prometheus的弹性伸缩 小结 第9章 Prometheus Operator 使用Opertor管理Prometheus 使用Prometheus Operator监控用户应用 使用Prometheus Operator管理Alertmanager 第10章 使用Prometheus监控Rancher集群 参考资料