You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

108 lines
11 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 第25讲 | 谈谈JVM内存区域的划分哪些区域可能发生OutOfMemoryError?
今天我将从内存管理的角度进一步探索Java虚拟机JVM。垃圾收集机制为我们打理了很多繁琐的工作大大提高了开发的效率但是垃圾收集也不是万能的懂得JVM内部的内存结构、工作机制是设计高扩展性应用和诊断运行时问题的基础也是Java工程师进阶的必备能力。
今天我要问你的问题是谈谈JVM内存区域的划分哪些区域可能发生OutOfMemoryError
## 典型回答
通常可以把JVM内存区域分为下面几个方面其中有的区域是以线程为单位而有的区域则是整个JVM进程唯一的。
首先,**程序计数器**PCProgram Counter Register。在JVM规范中每个线程都有它自己的程序计数器并且任何时间一个线程都只有一个方法在执行也就是所谓的当前方法。程序计数器会存储当前线程正在执行的Java方法的JVM指令地址或者如果是在执行本地方法则是未指定值undefined
第二,**Java虚拟机栈**Java Virtual Machine Stack早期也叫Java栈。每个线程在创建时都会创建一个虚拟机栈其内部保存一个个的栈帧Stack Frame对应着一次次的Java方法调用。
前面谈程序计数器时提到了当前方法同理在一个时间点对应的只会有一个活动的栈帧通常叫作当前帧方法所在的类叫作当前类。如果在该方法中调用了其他方法对应的新的栈帧会被创建出来成为新的当前帧一直到它返回结果或者执行结束。JVM直接对Java栈的操作只有两个就是对栈帧的压栈和出栈。
栈帧中存储着局部变量表、操作数operand栈、动态链接、方法正常退出或者异常退出的定义等。
第三,**堆**Heap它是Java内存管理的核心区域用来放置Java对象实例几乎所有创建的Java对象实例都是被直接分配在堆上。堆被所有的线程共享在虚拟机启动时我们指定的“Xmx”之类参数就是用来指定最大堆空间等指标。
理所当然,堆也是垃圾收集器重点照顾的区域,所以堆内空间还会被不同的垃圾收集器进行进一步的细分,最有名的就是新生代、老年代的划分。
第四,**方法区**Method Area。这也是所有线程共享的一块内存区域用于存储所谓的元Meta数据例如类结构信息以及对应的运行时常量池、字段、方法代码等。
由于早期的Hotspot JVM实现很多人习惯于将方法区称为永久代Permanent Generation。Oracle JDK 8中将永久代移除同时增加了元数据区Metaspace
第五,**运行时常量池**Run-Time Constant Pool这是方法区的一部分。如果仔细分析过反编译的类文件结构你能看到版本号、字段、方法、超类、接口等各种信息还有一项信息就是常量池。Java的常量池可以存放各种常量信息不管是编译期生成的各种字面量还是需要在运行时决定的符号引用所以它比一般语言的符号表存储的信息更加宽泛。
第六,**本地方法栈**Native Method Stack。它和Java虚拟机栈是非常相似的支持对本地方法的调用也是每个线程都会创建一个。在Oracle Hotspot JVM中本地方法栈和Java虚拟机栈是在同一块儿区域这完全取决于技术实现的决定并未在规范中强制。
## 考点分析
这是个JVM领域的基础题目我给出的答案依据的是[JVM规范](https://docs.oracle.com/javase/specs/jvms/se9/html/jvms-2.html#jvms-2.5)中运行时数据区定义,这也和大多数书籍和资料解读的角度类似。
JVM内部的概念庞杂对于初学者比较晦涩我的建议是在工作之余还是要去阅读经典书籍比如我推荐过多次的《深入理解Java虚拟机》。
今天这一讲作为Java虚拟机内存管理的开篇我会侧重于
* 分析广义上的JVM内存结构或者说Java进程内存结构。
* 谈到Java内存模型不可避免的要涉及OutOfMemoryOOM问题那么在Java里面存在哪些种OOM的可能性分别对应哪个内存区域的异常状况呢
注意具体JVM的内存结构其实取决于其实现不同厂商的JVM或者同一厂商发布的不同版本都有可能存在一定差异。我在下面的分析中还会介绍Oracle Hotspot JVM的部分设计变化。
## 知识扩展
首先为了让你有个更加直观、清晰的印象我画了一个简单的内存结构图里面展示了我前面提到的堆、线程栈等区域并从数量上说明了什么是线程私有例如程序计数器、Java栈等以及什么是Java进程唯一。另外还额外划分出了直接内存等区域。
![](https://static001.geekbang.org/resource/image/36/bc/360b8f453e016cb641208a6a8fb589bc.png)
这张图反映了实际中Java进程内存占用与规范中定义的JVM运行时数据区之间的差别它可以看作是运行时数据区的一个超集。毕竟理论上的视角和现实中的视角是有区别的规范侧重的是通用的、无差别的部分而对于应用开发者来说只要是Java进程在运行时会占用都会影响到我们的工程实践。
我这里简要介绍两点区别:
* 直接内存Direct Memory区域它就是我在[专栏第12讲](http://time.geekbang.org/column/article/8393)中谈到的Direct Buffer所直接分配的内存也是个容易出现问题的地方。尽管在JVM工程师的眼中并不认为它是JVM内部内存的一部分也并未体现JVM内存模型中。
* JVM本身是个本地程序还需要其他的内存去完成各种基本任务比如JIT Compiler在运行时对热点方法进行编译就会将编译后的方法储存在Code Cache里面GC等功能需要运行在本地线程之中类似部分都需要占用内存空间。这些是实现JVM JIT等功能的需要但规范中并不涉及。
如果深入到JVM的实现细节你会发现一些结论似乎有些模棱两可比如
* Java对象是不是都创建在堆上的呢
我注意到有一些观点,认为通过[逃逸分析](https://en.wikipedia.org/wiki/Escape_analysis)JVM会在栈上分配那些不会逃逸的对象这在理论上是可行的但是取决于JVM设计者的选择。据我所知Oracle Hotspot JVM中并未这么做这一点在逃逸分析相关的[文档](https://docs.oracle.com/javase/8/docs/technotes/guides/vm/performance-enhancements-7.html#escapeAnalysis)里已经说明,所以可以明确所有的对象实例都是创建在堆上。
* 目前很多书籍还是基于JDK 7以前的版本JDK已经发生了很大变化Intern字符串的缓存和静态变量曾经都被分配在永久代上而永久代已经被元数据区取代。但是Intern字符串缓存和静态变量并不是被转移到元数据区而是直接在堆上分配所以这一点同样符合前面一点的结论对象实例都是分配在堆上。
接下来我们来看看什么是OOM问题它可能在哪些内存区域发生
首先OOM如果通俗点儿说就是JVM内存不够用了javadoc中对[OutOfMemoryError](https://docs.oracle.com/javase/9/docs/api/java/lang/OutOfMemoryError.html)的解释是,没有空闲内存,并且垃圾收集器也无法提供更多内存。
这里面隐含着一层意思是在抛出OutOfMemoryError之前通常垃圾收集器会被触发尽其所能去清理出空间例如
* 我在[专栏第4讲](http://time.geekbang.org/column/article/6970)的引用机制分析中已经提到了JVM会去尝试回收软引用指向的对象等。
* 在[java.nio.BIts.reserveMemory()](http://hg.openjdk.java.net/jdk/jdk/file/9f62267e79df/src/java.base/share/classes/java/nio/Bits.java) 方法中我们能清楚的看到System.gc()会被调用以清理空间这也是为什么在大量使用NIO的Direct Buffer之类时通常建议不要加下面的参数毕竟是个最后的尝试有可能避免一定的内存不足问题。
```
-XX:+DisableExplicitGC
```
当然也不是在任何情况下垃圾收集器都会被触发的比如我们去分配一个超大对象类似一个超大数组超过堆的最大值JVM可以判断出垃圾收集并不能解决这个问题所以直接抛出OutOfMemoryError。
从我前面分析的数据区的角度除了程序计数器其他区域都有可能会因为可能的空间不足发生OutOfMemoryError简单总结如下
* 堆内存不足是最常见的OOM原因之一抛出的错误信息是“java.lang.OutOfMemoryError:Java heap space”原因可能千奇百怪例如可能存在内存泄漏问题也很有可能就是堆的大小不合理比如我们要处理比较可观的数据量但是没有显式指定JVM堆大小或者指定数值偏小或者出现JVM处理引用不及时导致堆积起来内存无法释放等。
* 而对于Java虚拟机栈和本地方法栈这里要稍微复杂一点。如果我们写一段程序不断的进行递归调用而且没有退出条件就会导致不断地进行压栈。类似这种情况JVM实际会抛出StackOverFlowError当然如果JVM试图去扩展栈空间的的时候失败则会抛出OutOfMemoryError。
* 对于老版本的Oracle JDK因为永久代的大小是有限的并且JVM对永久代垃圾回收常量池回收、卸载不再需要的类型非常不积极所以当我们不断添加新类型的时候永久代出现OutOfMemoryError也非常多见尤其是在运行时存在大量动态类型生成的场合类似Intern字符串缓存占用太多空间也会导致OOM问题。对应的异常信息会标记出来和永久代相关“java.lang.OutOfMemoryError: PermGen space”。
* 随着元数据区的引入方法区内存已经不再那么窘迫所以相应的OOM有所改观出现OOM异常信息则变成了“java.lang.OutOfMemoryError: Metaspace”。
* 直接内存不足也会导致OOM这个已经[专栏第11讲](http://time.geekbang.org/column/article/8369)介绍过。
今天是JVM内存部分的第一讲算是我们先进行了热身准备我介绍了主要的内存区域以及在不同版本Hotspot JVM内部的变化并且分析了各区域是否可能产生OutOfMemoryError以及OOME发生的典型情况。
## 一课一练
关于今天我们讨论的题目你做到心中有数了吗今天的思考题是我在试图分配一个100M bytes大数组的时候发生了OOME但是GC日志显示明明堆上还有远不止100M的空间你觉得可能问题的原因是什么想要弄清楚这个问题还需要什么信息呢
请你在留言区写写你对这个问题的思考,我会选出经过认真思考的留言,送给你一份学习奖励礼券,欢迎你与我一起讨论。
你的朋友是不是也在准备面试呢?你可以“请朋友读”,把今天的题目分享给好友,或许你能帮到他。