Poison

关于持续 FullGC 的监控方案

当执行 FullGC 时,stop-the-world,JVM 其他线程均被暂停执行,基于 Java Agent 的监控方案全部失效,如:JMX Exporter 表现出来的现象就是采集端掉线,Prometheus 中心对 Java Agent 发起请求时因目标 JVM 正在 FullGC 而不能采集数据。那么,此种情况下如果需要监控 GC 情况,则只要保证监控器不使用同一 JVM 实例实现,如 eero 采用的方案为使用 Python 监听 gc.log 再进行上报的方式实现。

Garbagedog: How eero does continuous monitoring of Java garbage collection
garbagedog