141 lines
11 KiB
Markdown
141 lines
11 KiB
Markdown
|
# 26 | 答疑课堂:模块四热点问题解答
|
|||
|
|
|||
|
你好,我是刘超。
|
|||
|
|
|||
|
本周我们结束了“JVM性能监测及调优”的学习,这一期答疑课堂我精选了模块四中 11 位同学的留言,进行集中解答,希望也能对你有所帮助。另外,我想为坚持跟到现在的同学点个赞,期待我们能有更多的技术交流,共同成长。
|
|||
|
|
|||
|
## [第20讲](https://time.geekbang.org/column/article/106203)
|
|||
|
|
|||
|
![](https://static001.geekbang.org/resource/image/31/3a/31a205290c3b2391f115ee77f511a43a.jpeg)
|
|||
|
|
|||
|
很多同学都问到了类似“黑夜里的猫"问到的问题,所以我来集中回复一下。JVM的内存模型只是一个规范,方法区也是一个规范,一个逻辑分区,并不是一个物理空间,我们这里说的字符串常量放在堆内存空间中,是指实际的物理空间。
|
|||
|
|
|||
|
![](https://static001.geekbang.org/resource/image/2a/01/2ac5ee0c9a6fe67ce8f896be75d05f01.jpeg)
|
|||
|
|
|||
|
文灏的问题和上一个类似,一同回复一下。元空间是属于方法区的,方法区只是一个逻辑分区,而元空间是具体实现。所以类的元数据是存放在元空间,逻辑上属于方法区。
|
|||
|
|
|||
|
## [第21讲](https://time.geekbang.org/column/article/106953)
|
|||
|
|
|||
|
![](https://static001.geekbang.org/resource/image/f2/76/f2fa07e388f5a3dbe84bb12bfea5ee76.jpeg)
|
|||
|
|
|||
|
Liam同学,目前Hotspot虚拟机暂时不支持栈上分配对象。W.LI同学的留言值得参考,所以这里一同贴出来了。
|
|||
|
|
|||
|
![](https://static001.geekbang.org/resource/image/20/f2/20e59cb2df51bd171d41c81e074821f2.jpeg)
|
|||
|
|
|||
|
## [第22讲](https://time.geekbang.org/column/article/107396)
|
|||
|
|
|||
|
![](https://static001.geekbang.org/resource/image/09/25/09ada15236e8ceeef2558d6ab7505425.jpeg)
|
|||
|
|
|||
|
非常赞,Region这块,Jxin同学讲解得很到位。这里我再总结下CMS和G1的一些知识点。
|
|||
|
|
|||
|
CMS垃圾收集器是基于标记清除算法实现的,目前主要用于老年代垃圾回收。CMS收集器的GC周期主要由7个阶段组成,其中有两个阶段会发生stop-the-world,其它阶段都是并发执行的。
|
|||
|
|
|||
|
![](https://static001.geekbang.org/resource/image/50/aa/500c2f0e112ced378fd49a09c61c5caa.jpg)
|
|||
|
|
|||
|
G1垃圾收集器是基于标记整理算法实现的,是一个分代垃圾收集器,既负责年轻代,也负责老年代的垃圾回收。
|
|||
|
|
|||
|
跟之前各个分代使用连续的虚拟内存地址不一样,G1使用了一种 Region 方式对堆内存进行了划分,同样也分年轻代、老年代,但每一代使用的是N个不连续的Region内存块,每个Region占用一块连续的虚拟内存地址。
|
|||
|
|
|||
|
在G1中,还有一种叫 Humongous 区域,用于存储特别大的对象。G1内部做了一个优化,一旦发现没有引用指向巨型对象,则可直接在年轻代的YoungGC中被回收掉。
|
|||
|
|
|||
|
![](https://static001.geekbang.org/resource/image/f8/be/f832278afd5cdb94decd1f6826056dbe.jpg)
|
|||
|
|
|||
|
G1分为Young GC、Mix GC以及Full GC。
|
|||
|
|
|||
|
G1 Young GC主要是在Eden区进行,当Eden区空间不足时,则会触发一次Young GC。将Eden区数据移到Survivor空间时,如果Survivor空间不足,则会直接晋升到老年代。此时Survivor的数据也会晋升到老年代。Young GC的执行是并行的,期间会发生STW。
|
|||
|
|
|||
|
当堆空间的占用率达到一定阈值后会触发G1 Mix GC(阈值由命令参数-XX:InitiatingHeapOccupancyPercent设定,默认值45),Mix GC主要包括了四个阶段,其中只有并发标记阶段不会发生STW,其它阶段均会发生STW。
|
|||
|
|
|||
|
![](https://static001.geekbang.org/resource/image/b8/2f/b8090ff2c7ddf54fb5f6e3c19a36d32f.jpg)
|
|||
|
|
|||
|
G1和CMS主要的区别在于:
|
|||
|
|
|||
|
* CMS主要集中在老年代的回收,而G1集中在分代回收,包括了年轻代的Young GC以及老年代的Mix GC;
|
|||
|
* G1使用了Region方式对堆内存进行了划分,且基于标记整理算法实现,整体减少了垃圾碎片的产生;
|
|||
|
* 在初始化标记阶段,搜索可达对象使用到的Card Table,其实现方式不一样。
|
|||
|
|
|||
|
这里我简单解释下Card Table,在垃圾回收的时候都是从Root开始搜索,这会先经过年轻代再到老年代,也有可能老年代引用到年轻代对象,如果发生Young GC,除了从年轻代扫描根对象之外,还需要再从老年代扫描根对象,确认引用年轻代对象的情况。
|
|||
|
|
|||
|
**这种属于跨代处理,非常消耗性能。**为了避免在回收年轻代时跨代扫描整个老年代,CMS和G1都用到了Card Table来记录这些引用关系。只是G1在Card Table的基础上引入了RSet,每个Region初始化时,都会初始化一个RSet,RSet记录了其它Region中的对象引用本Region对象的关系。
|
|||
|
|
|||
|
除此之外,CMS和G1在解决并发标记时漏标的方式也不一样,CMS使用的是Incremental Update算法,而G1使用的是SATB算法。
|
|||
|
|
|||
|
首先,我们要了解在并发标记中,G1和CMS都是基于三色标记算法来实现的:
|
|||
|
|
|||
|
* 黑色:根对象,或者对象和对象中的子对象都被扫描;
|
|||
|
* 灰色:对象本身被扫描,但还没扫描对象中的子对象;
|
|||
|
* 白色:不可达对象。
|
|||
|
|
|||
|
基于这种标记有一个漏标的问题,也就是说,当一个白色标记对象,在垃圾回收被清理掉时,正好有一个对象引用了该白色标记对象,此时由于被回收掉了,就会出现对象丢失的问题。
|
|||
|
|
|||
|
为了避免上述问题,CMS采用了Incremental Update算法,只要在写屏障(write barrier)里发现一个白对象的引用被赋值到一个黑对象的字段里,那就把这个白对象变成灰色的。而在G1中,采用的是SATB算法,该算法认为开始时所有能遍历到的对象都是需要标记的,即认为都是活的。
|
|||
|
|
|||
|
G1具备Pause Prediction Model ,即停顿预测模型。用户可以设定整个GC过程中期望的停顿时间,用参数-XX:MaxGCPauseMillis可以指定一个G1收集过程的目标停顿时间,默认值200ms。
|
|||
|
|
|||
|
G1会根据这个模型统计出来的历史数据,来预测一次垃圾回收所需要的Region数量,通过控制Region数来控制目标停顿时间的实现。
|
|||
|
|
|||
|
![](https://static001.geekbang.org/resource/image/91/b4/915e9793981a278112087f0c880b96b4.jpeg)
|
|||
|
|
|||
|
Liam提出的这两个问题都非常好。
|
|||
|
|
|||
|
不管什么GC,都会发送stop-the-world,区别是发生的时间长短。而这个时间跟垃圾收集器又有关系,Serial、PartNew、Parallel Scavenge收集器无论是串行还是并行,都会挂起用户线程,而CMS和G1在并发标记时,是不会挂起用户线程的,但其它时候一样会挂起用户线程,stop the world 的时间相对来说就小很多了。
|
|||
|
|
|||
|
Major Gc 在很多参考资料中是等价于 Full GC的,我们也可以发现很多性能监测工具中只有Minor GC 和 Full GC。一般情况下,一次Full GC将会对年轻代、老年代、元空间以及堆外内存进行垃圾回收。触发Full GC的原因有很多:
|
|||
|
|
|||
|
* 当年轻代晋升到老年代的对象大小,并比目前老年代剩余的空间大小还要大时,会触发Full GC;
|
|||
|
* 当老年代的空间使用率超过某阈值时,会触发Full GC;
|
|||
|
* 当元空间不足时(JDK1.7永久代不足),也会触发Full GC;
|
|||
|
* 当调用System.gc()也会安排一次Full GC。
|
|||
|
|
|||
|
![](https://static001.geekbang.org/resource/image/a8/24/a8a506a512922609669b4073d0dbc224.jpeg)
|
|||
|
|
|||
|
接下来解答 ninghtmare 的提问。我们可以通过 jstat -gc pid interval 查看每次GC之后,具体每一个分区的内存使用率变化情况。我们可以通过JVM的设置参数,来查看垃圾收集器的具体设置参数,使用的方式有很多,例如 jcmd pid VM.flags 就可以查看到相关的设置参数。
|
|||
|
|
|||
|
![](https://static001.geekbang.org/resource/image/26/2e/26d688a3af534fb00fe3b89d261e5c2e.jpg)
|
|||
|
|
|||
|
这里附上第22讲中,我总结的各个设置参数对应的垃圾收集器图表。
|
|||
|
|
|||
|
![](https://static001.geekbang.org/resource/image/e2/56/e29c9ac3e53ffbc8a5648644a87d6256.jpeg)
|
|||
|
|
|||
|
## [第23讲](https://time.geekbang.org/column/article/108139)
|
|||
|
|
|||
|
![](https://static001.geekbang.org/resource/image/bb/76/bb92ec845c715f9d36a6ce48a0c7d276.jpeg)
|
|||
|
|
|||
|
我又不乱来同学的留言真是没有乱来,细节掌握得很好!
|
|||
|
|
|||
|
前提是老年代有足够接受这些对象的空间,才会进行分配担保。如果老年代剩余空间小于每次Minor GC晋升到老年代的平均值,则会发起一次 Full GC。
|
|||
|
|
|||
|
![](https://static001.geekbang.org/resource/image/28/20/2838514b87e62d69bf51d7a7f12a0c20.jpeg)
|
|||
|
|
|||
|
看到这里,我发现爱提问的同学始终爱提问,非常鼓励啊,技术是需要交流的,也欢迎你有任何疑问,随时留言给我,我会知无不尽。
|
|||
|
|
|||
|
现在回答W.LI同学的问题。这个会根据我们创建对象占用的内存使用率,合理分配内存,并不仅仅考虑对象晋升的问题,还会综合考虑回收停顿时间等因素。针对某些特殊场景,我们可以手动来调优配置。
|
|||
|
|
|||
|
## [第24讲](https://time.geekbang.org/column/article/108582)
|
|||
|
|
|||
|
![](https://static001.geekbang.org/resource/image/10/24/1080a8574a1a1ded35b736ccbec40524.jpeg)
|
|||
|
|
|||
|
下面解答Geek\_75b4cd同学的问题。
|
|||
|
|
|||
|
我们知道,ThreadLocal是基于ThreadLocalMap实现的,这个Map的Entry继承了WeakReference,而Entry对象中的key使用了WeakReference封装,也就是说Entry中的key是一个弱引用类型,而弱引用类型只能存活在下次GC之前。
|
|||
|
|
|||
|
如果一个线程调用ThreadLocal的set设置变量,当前ThreadLocalMap则会新增一条记录,但由于发生了一次垃圾回收,此时的key值就会被回收,而value值依然存在内存中,由于当前线程一直存在,所以value值将一直被引用。.
|
|||
|
|
|||
|
这些被垃圾回收掉的key就会一直存在一条引用链的关系:Thread --> ThreadLocalMap–>Entry–>Value。这条引用链会导致Entry不会被回收,Value也不会被回收,但Entry中的key却已经被回收的情况发生,从而造成内存泄漏。
|
|||
|
|
|||
|
我们只需要在使用完该key值之后,将value值通过remove方法remove掉,就可以防止内存泄漏了。
|
|||
|
|
|||
|
![](https://static001.geekbang.org/resource/image/8d/9a/8da35d95d5b31e3f0a582dbd4d47fd9a.jpeg)
|
|||
|
|
|||
|
最后一个问题来自于WL同学。
|
|||
|
|
|||
|
内存泄漏是指不再使用的对象无法得到及时的回收,持续占用内存空间,从而造成内存空间的浪费。例如,我在[第03讲](https://time.geekbang.org/column/article/97215)中说到的,Java6中substring方法就可能会导致内存泄漏。
|
|||
|
|
|||
|
当调用substring方法时会调用new string构造函数,此时会复用原来字符串的char数组,而如果我们仅仅是用substring获取一小段字符,而在原本string字符串非常大的情况下,substring的对象如果一直被引用,由于substring里的char数组仍然指向原字符串,此时string字符串也无法回收,从而导致内存泄露。
|
|||
|
|
|||
|
内存溢出则是发生了OutOfMemoryException,内存溢出的情况有很多,例如堆内存空间不足,栈空间不足,还有方法区空间不足等都会导致内存溢出。
|
|||
|
|
|||
|
内存泄漏与内存溢出的关系:内存泄漏很容易导致内存溢出,但内存溢出不一定是内存泄漏导致的。
|
|||
|
|
|||
|
今天的答疑就到这里,如果你还有其它问题,请在留言区中提出,我会一一解答。最后欢迎你点击“请朋友读”,把今天的内容分享给身边的朋友,邀请他加入讨论。
|
|||
|
|