当 JVM 执行 FullGC 时,JVM 应用线程均被暂停执行,基于 Java Agent 的监控方案全部失效,如 JMX Exporter 表现出来的现象就是采集端掉线,Prometheus 中心对 Java Agent 发起请求时因目标 JVM 正在 FullGC 而不能采集数据。不过因为健康检查等组件的存在,影响不会很大,因为实例被探测为不可用后就会被自动移除。那么,此种情况下如果需要实时监控 GC 情况,则只要保证监控器不使用同一 JVM 实例实现,如 eero 采用的方案为使用 Python 监听 gc.log
再进行上报的方式实现。如果无需实时监控 FullGC 的话,可以使用 micrometer 提供的 JvmGcMetrics
进行 GC 信息监控,其基于 JMX 中 NotificationEmitter
的方式实现了基于通知方式的 GC 数据更新,如果发生 FullGC,数据可能会因为 STW 不能马上被采集到,但是后续采集时依然能够采集到,源码位于 JvmGcMetrics.java at v1.8.2:
1 | class GcMetricsNotificationListener implements NotificationListener { |
其 GC 数据来源于 GarbageCollectorImpl
类,该类继承了 MemoryManagerImpl
类,而 MemoryManagerImpl
类又继承了 NotificationEmitterSupport
以支持 GC 事件通知发送,相关源码可参考文末链接。
同理,也可以采用 micrometer 的 JvmHeapPressureMetrics
进行 JVM 堆内内存压力监控,通过监测 GC 后内存占比及 GC 耗时占比可以计算出堆内内存占比,源码位于:micrometer/JvmHeapPressureMetrics.java at main · micrometer-metrics/micrometer · GitHub。思想与 TeamCity Memory Monitor | TeamCity On-Premises 类似。
Reference
Garbagedog: How eero does continuous monitoring of Java garbage collection
garbagedog
jdk/GarbageCollectorImpl.java at jdk8-b120 · openjdk/jdk · GitHub
jdk/MemoryManagerImpl.java at jdk8-b120 · openjdk/jdk · GitHub
jdk/NotificationEmitterSupport.java at jdk8-b120 · openjdk/jdk · GitHub