gitbook/Java性能调优实战/docs/108139.md
2022-09-03 22:05:03 +08:00

11 KiB
Raw Permalink Blame History

24 | 如何优化JVM内存分配

你好,我是刘超。

JVM调优是一个系统而又复杂的过程但我们知道在大多数情况下我们基本不用去调整JVM内存分配因为一些初始化的参数已经可以保证应用服务正常稳定地工作了。

但所有的调优都是有目标性的JVM内存分配调优也一样。没有性能问题的时候我们自然不会随意改变JVM内存分配的参数。那有了问题呢有了什么样的性能问题我们需要对其进行调优呢又该如何调优呢这就是我今天要分享的内容。

JVM内存分配性能问题

谈到JVM内存表现出的性能问题时你可能会想到一些线上的JVM内存溢出事故。但这方面的事故往往是应用程序创建对象导致的内存回收对象难一般属于代码编程问题。

但其实很多时候在应用服务的特定场景下JVM内存分配不合理带来的性能表现并不会像内存溢出问题这么突出。可以说如果你没有深入到各项性能指标中去是很难发现其中隐藏的性能损耗。

JVM内存分配不合理最直接的表现就是频繁的GC这会导致上下文切换等性能问题从而降低系统的吞吐量、增加系统的响应时间。因此如果你在线上环境或性能测试时发现频繁的GC且是正常的对象创建和回收这个时候就需要考虑调整JVM内存分配了从而减少GC所带来的性能开销。

对象在堆中的生存周期

了解了性能问题那需要做的势必就是调优了。但先别急在了解JVM内存分配的调优过程之前我们先来看看一个新创建的对象在堆内存中的生存周期为后面的学习打下基础。

第20讲我讲过JVM内存模型。我们知道在JVM内存模型的堆中堆被划分为新生代和老年代新生代又被进一步划分为Eden区和Survivor区最后Survivor由From Survivor和To Survivor组成。

当我们新建一个对象时对象会被优先分配到新生代的Eden区中这时虚拟机会给对象定义一个对象年龄计数器通过参数-XX:MaxTenuringThreshold设置

同时也有另外一种情况当Eden空间不足时虚拟机将会执行一个新生代的垃圾回收Minor GC。这时JVM会把存活的对象转移到Survivor中并给对象的年龄+1。对象在Survivor中同样也会经历MinorGC每经过一次MinorGC对象的年龄将会+1。

当然了,内存空间也是有设置阈值的,可以通过参数-XX:PetenureSizeThreshold设置直接被分配到老年代的最大对象这时如果分配的对象超过了设置的阀值对象就会直接被分配到老年代这样做的好处就是可以减少新生代的垃圾回收。

查看JVM堆内存分配

我们知道了一个对象从创建至回收到堆中的过程接下来我们再来了解下JVM堆内存是如何分配的。在默认不配置JVM堆内存大小的情况下JVM根据默认值来配置当前内存大小。我们可以通过以下命令来查看堆内存配置的默认值

java -XX:+PrintFlagsFinal -version | grep HeapSize 
jmap -heap 17284

通过命令我们可以获得在这台机器上启动的JVM默认最大堆内存为1953MB初始化大小为124MB。

在JDK1.7中默认情况下年轻代和老年代的比例是1:2我们可以通过XX:NewRatio重置该配置项。年轻代中的Eden和To Survivor、From Survivor的比例是8:1:1我们可以通过-XX:SurvivorRatio重置该配置项。

在JDK1.7中如果开启了-XX:+UseAdaptiveSizePolicy配置项JVM将会动态调整Java堆中各个区域的大小以及进入老年代的年龄XX:NewRatio和-XX:SurvivorRatio将会失效而JDK1.8是默认开启-XX:+UseAdaptiveSizePolicy配置项的。

还有在JDK1.8中不要随便关闭UseAdaptiveSizePolicy配置项除非你已经对初始化堆内存/最大堆内存、年轻代/老年代以及Eden区/Survivor区有非常明确的规划了。否则JVM将会分配最小堆内存年轻代和老年代按照默认比例1:2进行分配年轻代中的Eden和Survivor则按照默认比例8:2进行分配。这个内存分配未必是应用服务的最佳配置因此可能会给应用服务带来严重的性能问题。

JVM内存分配的调优过程

我们先使用JVM的默认配置观察应用服务的运行情况下面我将结合一个实际案例来讲述。现模拟一个抢购接口假设需要满足一个5W的并发请求且每次请求会产生20KB对象我们可以通过千级并发创建一个1MB对象的接口来模拟万级并发请求产生大量对象的场景具体代码如下

	
	@RequestMapping(value = "/test1")
	public String test1(HttpServletRequest request) {
		List<Byte[]> temp = new ArrayList<Byte[]>();
		
		Byte[] b = new Byte[1024*1024];
		temp.add(b);
		
		return "success";
	}

AB压测

分别对应用服务进行压力测试,以下是请求接口的吞吐量和响应时间在不同并发用户数下的变化情况:

可以看到当并发数量到了一定值时吞吐量就上不去了响应时间也迅速增加。那么在JVM内部运行又是怎样的呢

分析GC日志

此时我们可以通过GC日志查看具体的回收日志。我们可以通过设置VM配置参数将运行期间的GC日志 dump下来具体配置参数如下

 -XX:+PrintGCTimeStamps -XX:+PrintGCDetails -Xloggc:/log/heapTest.log

以下是各个配置项的说明:

  • -XX:PrintGCTimeStamps打印GC具体时间
  • -XX:PrintGCDetails 打印出GC详细日志
  • -Xloggc: pathGC日志生成路径。

收集到GC日志后我们就可以使用第22讲中介绍过的GCViewer工具打开它进而查看到具体的GC日志如下

主页面显示FullGC发生了13次右下角显示年轻代和老年代的内存使用率几乎达到了100%。而FullGC会导致stop-the-world的发生从而严重影响到应用服务的性能。此时我们需要调整堆内存的大小来减少FullGC的发生。

参考指标

我们可以将某些指标的预期值作为参考指标上面的GC频率就是其中之一那么还有哪些指标可以为我们提供一些具体的调优方向呢

**GC频率**高频的FullGC会给系统带来非常大的性能消耗虽然MinorGC相对FullGC来说好了许多但过多的MinorGC仍会给系统带来压力。

**内存:**这里的内存指的是堆内存大小堆内存又分为年轻代内存和老年代内存。首先我们要分析堆内存大小是否合适其实是分析年轻代和老年代的比例是否合适。如果内存不足或分配不均匀会增加FullGC严重的将导致CPU持续爆满影响系统性能。

**吞吐量:**频繁的FullGC将会引起线程的上下文切换增加系统的性能开销从而影响每次处理的线程请求最终导致系统的吞吐量下降。

**延时:**JVM的GC持续时间也会影响到每次请求的响应时间。

具体调优方法

**调整堆内存空间减少FullGC**通过日志分析堆内存基本被用完了而且存在大量FullGC这意味着我们的堆内存严重不足这个时候我们需要调大堆内存空间。

java -jar -Xms4g -Xmx4g heapTest-0.0.1-SNAPSHOT.jar

以下是各个配置项的说明:

  • -Xms堆初始大小
  • -Xmx堆最大值。

调大堆内存之后我们再来测试下性能情况发现吞吐量提高了40%左右响应时间也降低了将近50%。

再查看GC日志发现FullGC频率降低了老年代的使用率只有16%了。

**调整年轻代减少MinorGC**通过调整堆内存大小我们已经提升了整体的吞吐量降低了响应时间。那还有优化空间吗我们还可以将年轻代设置得大一些从而减少一些MinorGC第22讲有通过降低Minor GC频率来提高系统性能的详解

java -jar -Xms4g -Xmx4g -Xmn3g heapTest-0.0.1-SNAPSHOT.jar

再进行AB压测发现吞吐量上去了。

再查看GC日志发现MinorGC也明显降低了GC花费的总时间也减少了。

**设置Eden、Survivor区比例**在JVM中如果开启 AdaptiveSizePolicy则每次 GC 后都会重新计算 Eden、From Survivor和 To Survivor区的大小计算依据是 GC 过程中统计的 GC 时间、吞吐量、内存占用量。这个时候SurvivorRatio默认设置的比例会失效。

在JDK1.8中默认是开启AdaptiveSizePolicy的我们可以通过-XX:-UseAdaptiveSizePolicy关闭该项配置或显示运行-XX:SurvivorRatio=8将Eden、Survivor的比例设置为8:2。大部分新对象都是在Eden区创建的我们可以固定Eden区的占用比例来调优JVM的内存分配性能。

再进行AB性能测试我们可以看到吞吐量提升了响应时间降低了。

总结

JVM内存调优通常和GC调优是互补的基于以上调优我们可以继续对年轻代和堆内存的垃圾回收算法进行调优。这里可以结合上一讲的内容一起完成JVM调优。

虽然分享了一些JVM内存分配调优的常用方法但我还是建议你在进行性能压测后如果没有发现突出的性能瓶颈就继续使用JVM默认参数起码在大部分的场景下默认配置已经可以满足我们的需求了。但满足不了也不要慌张结合今天所学的内容去实践一下相信你会有新的收获。

思考题

以上我们都是基于堆内存分配来优化系统性能的但在NIO的Socket通信中其实还使用到了堆外内存来减少内存拷贝实现Socket通信优化。你知道堆外内存是如何创建和回收的吗

期待在留言区看到你的见解。也欢迎你点击“请朋友读”,把今天的内容分享给身边的朋友,邀请他一起讨论。