You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

177 lines
12 KiB
Markdown

2 years ago
# 第4讲 | 强引用、软引用、弱引用、幻象引用有什么区别?
在Java语言中除了原始数据类型的变量其他所有都是所谓的引用类型指向各种不同的对象理解引用对于掌握Java对象生命周期和JVM内部相关机制非常有帮助。
今天我要问你的问题是,强引用、软引用、弱引用、幻象引用有什么区别?具体使用场景是什么?
## 典型回答
不同的引用类型,主要体现的是**对象不同的可达性reachable状态和对垃圾收集的影响**。
所谓强引用“Strong” Reference就是我们最常见的普通对象引用只要还有强引用指向一个对象就能表明对象还“活着”垃圾收集器不会碰这种对象。对于一个普通的对象如果没有其他的引用关系只要超过了引用的作用域或者显式地将相应引用赋值为null就是可以被垃圾收集的了当然具体回收时机还是要看垃圾收集策略。
软引用SoftReference是一种相对强引用弱化一些的引用可以让对象豁免一些垃圾收集只有当JVM认为内存不足时才会去试图回收软引用指向的对象。JVM会确保在抛出OutOfMemoryError之前清理软引用指向的对象。软引用通常用来实现内存敏感的缓存如果还有空闲内存就可以暂时保留缓存当内存不足时清理掉这样就保证了使用缓存的同时不会耗尽内存。
弱引用WeakReference并不能使对象豁免垃圾收集仅仅是提供一种访问在弱引用状态下对象的途径。这就可以用来构建一种没有特定约束的关系比如维护一种非强制性的映射关系如果试图获取时对象还在就使用它否则重现实例化。它同样是很多缓存实现的选择。
对于幻象引用有时候也翻译成虚引用你不能通过它访问对象。幻象引用仅仅是提供了一种确保对象被finalize以后做某些事情的机制比如通常用来做所谓的Post-Mortem清理机制我在专栏上一讲中介绍的Java平台自身Cleaner机制等也有人利用幻象引用监控对象的创建和销毁。
## 考点分析
这道面试题,属于既偏门又非常高频的一道题目。说它偏门,是因为在大多数应用开发中,很少直接操作各种不同引用,虽然我们使用的类库、框架可能利用了其机制。它被频繁问到,是因为这是一个综合性的题目,既考察了我们对基础概念的理解,也考察了对底层对象生命周期、垃圾收集机制等的掌握。
充分理解这些引用对于我们设计可靠的缓存等框架或者诊断应用OOM等问题会很有帮助。比如诊断MySQL connector-j驱动在特定模式下useCompression=true的内存泄漏问题就需要我们理解怎么排查幻象引用的堆积问题。
## 知识扩展
1.对象可达性状态流转分析
首先请你看下面流程图我这里简单总结了对象生命周期和不同可达性状态以及不同状态可能的改变关系可能未必100%严谨,来阐述下可达性的变化。
![](https://static001.geekbang.org/resource/image/36/b0/36d3c7b158eda9421ef32463cb4d4fb0.png)
我来解释一下上图的具体状态这是Java定义的不同可达性级别reachability level具体如下
* 强可达Strongly Reachable就是当一个对象可以有一个或多个线程可以不通过各种引用访问到的情况。比如我们新创建一个对象那么创建它的线程对它就是强可达。
* 软可达Softly Reachable就是当我们只能通过软引用才能访问到对象的状态。
* 弱可达Weakly Reachable类似前面提到的就是无法通过强引用或者软引用访问只能通过弱引用访问时的状态。这是十分临近finalize状态的时机当弱引用被清除的时候就符合finalize的条件了。
* 幻象可达Phantom Reachable上面流程图已经很直观了就是没有强、软、弱引用关联并且finalize过了只有幻象引用指向这个对象的时候。
* 当然还有一个最后的状态就是不可达unreachable意味着对象可以被清除了。
判断对象可达性是JVM垃圾收集器决定如何处理对象的一部分考虑。
所有引用类型都是抽象类java.lang.ref.Reference的子类你可能注意到它提供了get()方法:
![](https://static001.geekbang.org/resource/image/ba/3e/bae702d46c665e12113f5abd876eb53e.png)
除了幻象引用因为get永远返回null如果对象还没有被销毁都可以通过get方法获取原有对象。这意味着利用软引用和弱引用我们可以将访问到的对象重新指向强引用也就是人为的改变了对象的可达性状态这也是为什么我在上面图里有些地方画了双向箭头。
所以,对于软引用、弱引用之类,垃圾收集器可能会存在二次确认的问题,以保证处于弱引用状态的对象,没有改变为强引用。
但是,你觉得这里有没有可能出现什么问题呢?
不错如果我们错误的保持了强引用比如赋值给了static变量那么对象可能就没有机会变回类似弱引用的可达性状态了就会产生内存泄漏。所以检查弱引用指向对象是否被垃圾收集也是诊断是否有特定内存泄漏的一个思路如果我们的框架使用到弱引用又怀疑有内存泄漏就可以从这个角度检查。
2.引用队列ReferenceQueue使用
谈到各种引用的编程就必然要提到引用队列。我们在创建各种引用并关联到相应对象时可以选择是否需要关联引用队列JVM会在特定时机将引用enqueue到队列里我们可以从队列里获取引用remove方法在这里实际是有获取的意思进行相关后续逻辑。尤其是幻象引用get方法只返回null如果再不指定引用队列基本就没有意义了。看看下面的示例代码。利用引用队列我们可以在对象处于相应状态时对于幻象引用就是前面说的被finalize了处于幻象可达状态执行后期处理逻辑。
```
Object counter = new Object();
ReferenceQueue refQueue = new ReferenceQueue<>();
PhantomReference<Object> p = new PhantomReference<>(counter, refQueue);
counter = null;
System.gc();
try {
// Remove是一个阻塞方法可以指定timeout或者选择一直阻塞
Reference<Object> ref = refQueue.remove(1000L);
if (ref != null) {
// do something
}
} catch (InterruptedException e) {
// Handle it
}
```
3.显式地影响软引用垃圾收集
前面泛泛提到了引用对垃圾收集的影响尤其是软引用到底JVM内部是怎么处理它的其实并不是非常明确。那么我们能不能使用什么方法来影响软引用的垃圾收集呢
答案是有的。软引用通常会在最后一次引用后还能保持一段时间默认值是根据堆剩余空间计算的以M bytes为单位。从Java 1.3.1开始,提供了-XX:SoftRefLRUPolicyMSPerMB参数我们可以以毫秒milliseconds为单位设置。比如下面这个示例就是设置为3秒3000毫秒
```
-XX:SoftRefLRUPolicyMSPerMB=3000
```
这个剩余空间其实会受不同JVM模式影响对于Client模式比如通常的Windows 32 bit JDK剩余空间是计算当前堆里空闲的大小所以更加倾向于回收而对于server模式JVM则是根据-Xmx指定的最大值来计算。
本质上这个行为还是个黑盒取决于JVM实现即使是上面提到的参数在新版的JDK上也未必有效另外Client模式的JDK已经逐步退出历史舞台。所以在我们应用时可以参考类似设置但不要过于依赖它。
4.诊断JVM引用情况
如果你怀疑应用存在引用或finalize导致的回收问题可以有很多工具或者选项可供选择比如HotSpot JVM自身便提供了明确的选项PrintReferenceGC去获取相关信息我指定了下面选项去使用JDK 8运行一个样例应用
```
-XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintReferenceGC
```
这是JDK 8使用ParrallelGC收集的垃圾收集日志各种引用数量非常清晰。
```
0.403: [GC (Allocation Failure) 0.871: [SoftReference, 0 refs, 0.0000393 secs]0.871: [WeakReference, 8 refs, 0.0000138 secs]0.871: [FinalReference, 4 refs, 0.0000094 secs]0.871: [PhantomReference, 0 refs, 0 refs, 0.0000085 secs]0.871: [JNI Weak Reference, 0.0000071 secs][PSYoungGen: 76272K->10720K(141824K)] 128286K->128422K(316928K), 0.4683919 secs] [Times: user=1.17 sys=0.03, real=0.47 secs]
```
**注意JDK 9对JVM和垃圾收集日志进行了广泛的重构**类似PrintGCTimeStamps和PrintReferenceGC已经不再存在我在专栏后面的垃圾收集主题里会更加系统的阐述。
5.Reachability Fence
除了我前面介绍的几种基本引用类型我们也可以通过底层API来达到强引用的效果这就是所谓的设置**reachability fence**。
为什么需要这种机制呢考虑一下这样的场景按照Java语言规范如果一个对象没有指向强引用就符合垃圾收集的标准有些时候对象本身并没有强引用但是也许它的部分属性还在被使用这样就导致诡异的问题所以我们需要一个方法在没有强引用情况下通知JVM对象是在被使用的。说起来有点绕我们来看看Java 9中提供的案例。
```
class Resource {
private static ExternalResource[] externalResourceArray = ...
int myIndex; Resource(...) {
myIndex = ...
externalResourceArray[myIndex] = ...;
...
}
protected void finalize() {
externalResourceArray[myIndex] = null;
...
}
public void action() {
try {
// 需要被保护的代码
int i = myIndex;
Resource.update(externalResourceArray[i]);
} finally {
// 调用reachbilityFence明确保障对象strongly reachable
Reference.reachabilityFence(this);
}
}
private static void update(ExternalResource ext) {
ext.status = ...;
}
}
```
方法action的执行依赖于对象的部分属性所以被特定保护了起来。否则如果我们在代码中像下面这样调用那么就可能会出现困扰因为没有强引用指向我们创建出来的Resource对象JVM对它进行finalize操作是完全合法的。
```
new Resource().action()
```
类似的书写结构,在异步编程中似乎是很普遍的,因为异步编程中往往不会用传统的“执行->返回->使用”的结构。
在Java 9之前实现类似功能相对比较繁琐有的时候需要采取一些比较隐晦的小技巧。幸好java.lang.ref.Reference给我们提供了新方法它是JEP 193: Variable Handles的一部分将Java平台底层的一些能力暴露出来
```
static void reachabilityFence(Object ref)
```
在JDK源码中reachabilityFence大多使用在Executors或者类似新的HTTP/2客户端代码中大部分都是异步调用的情况。编程中可以按照上面这个例子将需要reachability保障的代码段利用try-finally包围起来在finally里明确声明对象强可达。
今天我总结了Java语言提供的几种引用类型、相应可达状态以及对于JVM工作的意义并分析了引用队列使用的一些实际情况最后介绍了在新的编程模式下如何利用API去保障对象不被意外回收希望对你有所帮助。
## 一课一练
关于今天我们讨论的题目你做到心中有数了吗?给你留一道练习题,你能从自己的产品或者第三方类库中找到使用各种引用的案例吗?它们都试图解决什么问题?
请你在留言区写写你的答案,我会选出经过认真思考的留言,送给你一份学习鼓励金,欢迎你与我一起讨论。
你的朋友是不是也在准备面试呢?你可以“请朋友读”,把今天的题目分享出去,或许你能帮到他。