You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

198 lines
12 KiB
Markdown

2 years ago
# 第17讲 | 一个线程两次调用start()方法会出现什么情况?
今天我们来深入聊聊线程相信大家对于线程这个概念都不陌生它是Java并发的基础元素理解、操纵、诊断线程是Java工程师的必修课但是你真的掌握线程了吗
今天我要问你的问题是一个线程两次调用start()方法会出现什么情况?谈谈线程的生命周期和状态转移。
## 典型回答
Java的线程是不允许启动两次的第二次调用必然会抛出IllegalThreadStateException这是一种运行时异常多次调用start被认为是编程错误。
关于线程生命周期的不同状态在Java 5以后线程状态被明确定义在其公共内部枚举类型java.lang.Thread.State中分别是
* 新建NEW表示线程被创建出来还没真正启动的状态可以认为它是个Java内部状态。
* 就绪RUNNABLE表示该线程已经在JVM中执行当然由于执行需要计算资源它可能是正在运行也可能还在等待系统分配给它CPU片段在就绪队列里面排队。
* 在其他一些分析中会额外区分一种状态RUNNING但是从Java API的角度并不能表示出来。
* 阻塞BLOCKED这个状态和我们前面两讲介绍的同步非常相关阻塞表示线程在等待Monitor lock。比如线程试图通过synchronized去获取某个锁但是其他线程已经独占了那么当前线程就会处于阻塞状态。
* 等待WAITING表示正在等待其他线程采取某些操作。一个常见的场景是类似生产者消费者模式发现任务条件尚未满足就让当前消费者线程等待wait另外的生产者线程去准备任务数据然后通过类似notify等动作通知消费线程可以继续工作了。Thread.join()也会令线程进入等待状态。
* 计时等待TIMED\_WAIT其进入条件和等待状态类似但是调用的是存在超时条件的方法比如wait或join等方法的指定超时版本如下面示例
```
public final native void wait(long timeout) throws InterruptedException;
```
* 终止TERMINATED不管是意外退出还是正常执行结束线程已经完成使命终止运行也有人把这个状态叫作死亡。
在第二次调用start()方法的时候线程可能处于终止或者其他非NEW状态但是不论如何都是不可以再次启动的。
## 考点分析
今天的问题可以算是个常见的面试热身题目,前面的给出的典型回答,算是对基本状态和简单流转的一个介绍,如果觉得还不够直观,我在下面分析会对比一个状态图进行介绍。总的来说,理解线程对于我们日常开发或者诊断分析,都是不可或缺的基础。
面试官可能会以此为契机,从各种不同角度考察你对线程的掌握:
* 相对理论一些的面试官可以会问你线程到底是什么以及Java底层实现方式。
* 线程状态的切换,以及和锁等并发工具类的互动。
* 线程编程时容易踩的坑与建议等。
可以看出,仅仅是一个线程,就有非常多的内容需要掌握。我们选择重点内容,开始进入详细分析。
## 知识扩展
首先,我们来整体看一下线程是什么?
从操作系统的角度可以简单认为线程是系统调度的最小单元一个进程可以包含多个线程作为任务的真正运作者有自己的栈Stack、寄存器Register、本地存储Thread Local但是会和进程内其他线程共享文件描述符、虚拟地址空间等。
在具体实现中线程还分为内核线程、用户线程Java的线程实现其实是与虚拟机相关的。对于我们最熟悉的Sun/Oracle JDK其线程也经历了一个演进过程基本上在Java 1.2之后JDK已经抛弃了所谓的[Green Thread](https://en.wikipedia.org/wiki/Green_threads),也就是用户调度的线程,现在的模型是一对一映射到操作系统内核线程。
如果我们来看Thread的源码你会发现其基本操作逻辑大都是以JNI形式调用的本地代码。
```
private native void start0();
private native void setPriority0(int newPriority);
private native void interrupt0();
```
这种实现有利有弊总体上来说Java语言得益于精细粒度的线程和相关的并发操作其构建高扩展性的大型应用的能力已经毋庸置疑。但是其复杂性也提高了并发编程的门槛近几年的Go语言等提供了协程[coroutine](https://en.wikipedia.org/wiki/Coroutine)大大提高了构建并发应用的效率。于此同时Java也在[Loom](http://openjdk.java.net/projects/loom/)项目中孕育新的类似轻量级用户线程Fiber等机制也许在不久的将来就可以在新版JDK中使用到它。
下面,我来分析下线程的基本操作。如何创建线程想必你已经非常熟悉了,请看下面的例子:
```
Runnable task = () -> {System.out.println("Hello World!");};
Thread myThread = new Thread(task);
myThread.start();
myThread.join();
```
我们可以直接扩展Thread类然后实例化。但在本例中我选取了另外一种方式就是实现一个Runnable将代码逻放在Runnable中然后构建Thread并启动start等待结束join
Runnable的好处是不会受Java不支持类多继承的限制重用代码实现当我们需要重复执行相应逻辑时优点明显。而且也能更好的与现代Java并发库中的Executor之类框架结合使用比如将上面start和join的逻辑完全写成下面的结构
```
Future future = Executors.newFixedThreadPool(1)
.submit(task)
.get();
```
这样我们就不用操心线程的创建和管理也能利用Future等机制更好地处理执行结果。线程生命周期通常和业务之间没有本质联系混淆实现需求和业务需求就会降低开发的效率。
从线程生命周期的状态开始展开那么在Java编程中有哪些因素可能影响线程的状态呢主要有
* 线程自身的方法除了start还有多个join方法等待线程结束yield是告诉调度器主动让出CPU另外就是一些已经被标记为过时的resume、stop、suspend之类据我所知在JDK最新版本中destory/stop方法将被直接移除。
* 基类Object提供了一些基础的wait/notify/notifyAll方法。如果我们持有某个对象的Monitor锁调用wait会让当前线程处于等待状态直到其他线程notify或者notifyAll。所以本质上是提供了Monitor的获取和释放的能力是基本的线程间通信方式。
* 并发类库中的工具比如CountDownLatch.await()会让当前线程进入等待状态直到latch被基数为0这可以看作是线程间通信的Signal。
我这里画了一个状态和方法之间的对应图:
![](https://static001.geekbang.org/resource/image/31/dc/3169b7ca899afeb0359f132fb77c29dc.png)
Thread和Object的方法听起来简单但是实际应用中被证明非常晦涩、易错这也是为什么Java后来又引入了并发包。总的来说有了并发包大多数情况下我们已经不再需要去调用wait/notify之类的方法了。
前面谈了不少理论下面谈谈线程API使用我会侧重于平时工作学习中容易被忽略的一些方面。
先来看看守护线程Daemon Thread有的时候应用中需要一个长期驻留的服务程序但是不希望其影响应用退出就可以将其设置为守护线程如果JVM发现只有守护线程存在时将结束进程具体可以参考下面代码段。**注意,必须在线程启动之前设置。**
```
Thread daemonThread = new Thread();
daemonThread.setDaemon(true);
daemonThread.start();
```
再来看看[Spurious wakeup](https://en.wikipedia.org/wiki/Spurious_wakeup)。尤其是在多核CPU的系统中线程等待存在一种可能就是在没有任何线程广播或者发出信号的情况下线程就被唤醒如果处理不当就可能出现诡异的并发问题所以我们在等待条件过程中建议采用下面模式来书写。
```
// 推荐
while ( isCondition()) {
waitForAConfition(...);
}
// 不推荐可能引入bug
if ( isCondition()) {
waitForAConfition(...);
}
```
Thread.onSpinWait()这是Java 9中引入的特性。我在[专栏第16讲](http://time.geekbang.org/column/article/9042)给你留的思考题中提到“自旋锁”spin-wait, busy-waiting也可以认为其不算是一种锁而是一种针对短期等待的性能优化技术。“onSpinWait()”没有任何行为上的保证而是对JVM的一个暗示JVM可能会利用CPU的pause指令进一步提高性能性能特别敏感的应用可以关注。
再有就是慎用[ThreadLocal](https://docs.oracle.com/javase/9/docs/api/java/lang/ThreadLocal.html)这是Java提供的一种保存线程私有信息的机制因为其在整个线程生命周期内有效所以可以方便地在一个线程关联的不同业务模块之间传递信息比如事务ID、Cookie等上下文相关信息。
它的实现结构,可以参考[源码](http://hg.openjdk.java.net/jdk/jdk/file/ee8524126794/src/java.base/share/classes/java/lang/ThreadLocal.java)数据存储于线程相关的ThreadLocalMap其内部条目是弱引用如下面片段。
```
static class ThreadLocalMap {
static class Entry extends WeakReference<ThreadLocal<?>> {
    /** The value associated with this ThreadLocal. */
    Object value;
    Entry(ThreadLocal<?> k, Object v) {
        super(k);
value = v;
    }
     }
  // …
}
```
当Key为null时该条目就变成“废弃条目”相关“value”的回收往往依赖于几个关键点即set、remove、rehash。
下面是set的示例我进行了精简和注释
```
private void set(ThreadLocal<?> key, Object value) {
Entry[] tab = table;
int len = tab.length;
int i = key.threadLocalHashCode & (len-1);
for (Entry e = tab[i];; …) {
    //…
    if (k == null) {
// 替换废弃条目
        replaceStaleEntry(key, value, i);
        return;
    }
      }
tab[i] = new Entry(key, value);
int sz = ++size;
//  扫描并清理发现的废弃条目,并检查容量是否超限
if (!cleanSomeSlots(i, sz) && sz >= threshold)
    rehash();// 清理废弃条目,如果仍然超限,则扩容(加倍)
}
```
具体的清理逻辑是实现在cleanSomeSlots和expungeStaleEntry之中如果你有兴趣可以自行阅读。
结合[专栏第4讲](http://time.geekbang.org/column/article/6970)介绍的引用类型我们会发现一个特别的地方通常弱引用都会和引用队列配合清理机制使用但是ThreadLocal是个例外它并没有这么做。
这意味着,废弃项目的回收**依赖于显式地触发,否则就要等待线程结束**进而回收相应ThreadLocalMap这就是很多OOM的来源所以通常都会建议应用一定要自己负责remove并且不要和线程池配合因为worker线程往往是不会退出的。
今天我介绍了线程基础分析了生命周期中的状态和各种方法之间的对应关系这也有助于我们更好地理解synchronized和锁的影响并介绍了一些需要注意的操作希望对你有所帮助。
## 一课一练
关于今天我们讨论的题目你做到心中有数了吗今天我准备了一个有意思的问题写一个最简单的打印HelloWorld的程序说说看运行这个应用Java至少会创建几个线程呢然后思考一下如何明确验证你的结论真实情况很可能令你大跌眼镜哦。
请你在留言区写写你对这个问题的思考,我会选出经过认真思考的留言,送给你一份学习奖励礼券,欢迎你与我一起讨论。
你的朋友是不是也在准备面试呢?你可以“请朋友读”,把今天的题目分享给好友,或许你能帮到他。