Ganglia分布式监控系统在大数据集群中的应用

Question

Ganglia（gmond/gmetad）作为一个传统的分布式监控系统，请解释其架构设计（多播/单播模式）、指标收集流程、RRD（Round Robin Database）存储格式，以及在大数据集群监控中的优缺点。与Prometheus相比，Ganglia在哪些场景下仍有优势？给出一个gmond.conf中监控Had...

我还是少年 · Accepted Answer

Ganglia分布式监控系统： 1. 架构组件： gmond：每个节点运行的监控代理，收集CPU/内存/磁盘/网络/进程等指标 gmetad：中心收集器，从gmond拉取数据，写入RRD RRDtool：Round-Robin Database，固定大小的循环数据库 Web Frontend：PHP编写的可视化界面 2. 通信模式：多播模式（默认）： gmond(每个节点) ← 多播UDP → 自动发现 → gmetad(中心) 拉取 → RRD存储单播模式（跨机房）： gmond → 单播TCP/UDP → 指定的gmetad 3. gmond.conf关键配置（Hadoop集群）： 239.2.11.71 8649 <...

Ganglia分布式监控系统在大数据集群中的应用

回答

我还是少年