gitbook/Java核心技术面试精讲/docs/9373.md
2022-09-03 22:05:03 +08:00

312 lines
16 KiB
Markdown
Raw Permalink Blame History

This file contains invisible Unicode characters

This file contains invisible Unicode characters that are indistinguishable to humans but may be processed differently by a computer. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 第19讲 | Java并发包提供了哪些并发工具类
通过前面的学习我们一起回顾了线程、锁等各种并发编程的基本元素也逐步涉及了Java并发包中的部分内容相信经过前面的热身我们能够更快地理解Java并发包。
今天我要问你的问题是Java并发包提供了哪些并发工具类
## 典型回答
我们通常所说的并发包也就是java.util.concurrent及其子包集中了Java并发的各种基础工具类具体主要包括几个方面
* 提供了比synchronized更加高级的各种同步结构包括CountDownLatch、CyclicBarrier、Semaphore等可以实现更加丰富的多线程操作比如利用Semaphore作为资源控制器限制同时进行工作的线程数量。
* 各种线程安全的容器比如最常见的ConcurrentHashMap、有序的ConcurrentSkipListMap或者通过类似快照机制实现线程安全的动态数组CopyOnWriteArrayList等。
* 各种并发队列实现如各种BlockingQueue实现比较典型的ArrayBlockingQueue、 SynchronousQueue或针对特定场景的PriorityBlockingQueue等。
* 强大的Executor框架可以创建各种不同类型的线程池调度任务运行等绝大部分情况下不再需要自己从头实现线程池和任务调度器。
## 考点分析
这个题目主要考察你对并发包了解程度,以及是否有实际使用经验。我们进行多线程编程,无非是达到几个目的:
* 利用多线程提高程序的扩展能力,以达到业务对吞吐量的要求。
* 协调线程间调度、交互,以完成业务逻辑。
* 线程间传递数据和状态,这同样是实现业务逻辑的需要。
所以,这道题目只能算作简单的开始,往往面试官还会进一步考察如何利用并发包实现某个特定的用例,分析实现的优缺点等。
如果你在这方面的基础比较薄弱,我的建议是:
* 从总体上,把握住几个主要组成部分(前面回答中已经简要介绍)。
* 理解具体设计、实现和能力。
* 再深入掌握一些比较典型工具类的适用场景、用法甚至是原理,并熟练写出典型的代码用例。
掌握这些通常就够用了,毕竟并发包提供了方方面面的工具,其实很少有机会能在应用中全面使用过,扎实地掌握核心功能就非常不错了。真正特别深入的经验,还是得靠在实际场景中踩坑来获得。
## 知识扩展
首先,我们来看看并发包提供的丰富同步结构。前面几讲已经分析过各种不同的显式锁,今天我将专注于
* [CountDownLatch](https://docs.oracle.com/javase/9/docs/api/java/util/concurrent/CountDownLatch.html),允许一个或多个线程等待某些操作完成。
* [CyclicBarrier](https://docs.oracle.com/javase/9/docs/api/java/util/concurrent/CyclicBarrier.html),一种辅助性的同步结构,允许多个线程等待到达某个屏障。
* [Semaphore](https://docs.oracle.com/javase/9/docs/api/java/util/concurrent/Semaphore.html)Java版本的信号量实现。
Java提供了经典信号量[Semaphore](https://en.wikipedia.org/wiki/Semaphore_(programming))的实现它通过控制一定数量的允许permit的方式来达到限制通用资源访问的目的。你可以想象一下这个场景在车站、机场等出租车时当很多空出租车就位时为防止过度拥挤调度员指挥排队等待坐车的队伍一次进来5个人上车等这5个人坐车出发再放进去下一批这和Semaphore的工作原理有些类似。
你可以试试使用Semaphore来模拟实现这个调度过程
```
import java.util.concurrent.Semaphore;
public class UsualSemaphoreSample {
public static void main(String[] args) throws InterruptedException {
    System.out.println("Action...GO!");
    Semaphore semaphore = new Semaphore(5);
    for (int i = 0; i < 10; i++) {
        Thread t = new Thread(new SemaphoreWorker(semaphore));
        t.start();
    }
}
}
class SemaphoreWorker implements Runnable {
private String name;
private Semaphore semaphore;
public SemaphoreWorker(Semaphore semaphore) {
    this.semaphore = semaphore;
}
@Override
public void run() {
    try {
        log("is waiting for a permit!");
       semaphore.acquire();
        log("acquired a permit!");
        log("executed!");
    } catch (InterruptedException e) {
        e.printStackTrace();
    } finally {
        log("released a permit!");
        semaphore.release();
    }
}
private void log(String msg){
    if (name == null) {
        name = Thread.currentThread().getName();
    }
    System.out.println(name + " " + msg);
}
}
```
这段代码是比较典型的Semaphore示例其逻辑是线程试图获得工作允许得到许可则进行任务然后释放许可这时等待许可的其他线程就可获得许可进入工作状态直到全部处理结束。编译运行我们就能看到Semaphore的允许机制对工作线程的限制。
但是从具体节奏来看其实并不符合我们前面场景的需求因为本例中Semaphore的用法实际是保证一直有5个人可以试图乘车如果有1个人出发了立即就有排队的人获得许可而这并不完全符合我们前面的要求。
那么我再修改一下演示个非典型的Semaphore用法。
```
import java.util.concurrent.Semaphore;
public class AbnormalSemaphoreSample {
public static void main(String[] args) throws InterruptedException {
    Semaphore semaphore = new Semaphore(0);
    for (int i = 0; i < 10; i++) {
        Thread t = new Thread(new MyWorker(semaphore));
        t.start();
    }
    System.out.println("Action...GO!");
    semaphore.release(5);
    System.out.println("Wait for permits off");
    while (semaphore.availablePermits()!=0) {
        Thread.sleep(100L);
    }
    System.out.println("Action...GO again!");
    semaphore.release(5);
}
}
class MyWorker implements Runnable {
private Semaphore semaphore;
public MyWorker(Semaphore semaphore) {
    this.semaphore = semaphore;
}
@Override
public void run() {
    try {
        semaphore.acquire();
        System.out.println("Executed!");
    } catch (InterruptedException e) {
        e.printStackTrace();
    }
}
}
```
注意上面的代码更侧重的是演示Semaphore的功能以及局限性其实有很多线程编程中的反实践比如使用了sleep来协调任务执行而且使用轮询调用availalePermits来检测信号量获取情况这都是很低效并且脆弱的通常只是用在测试或者诊断场景。
总的来说我们可以看出Semaphore就是个**计数器****其基本逻辑基于acquire/release**,并没有太复杂的同步逻辑。
如果Semaphore的数值被初始化为1那么一个线程就可以通过acquire进入互斥状态本质上和互斥锁是非常相似的。但是区别也非常明显比如互斥锁是有持有者的而对于Semaphore这种计数器结构虽然有类似功能但其实不存在真正意义的持有者除非我们进行扩展包装。
下面来看看CountDownLatch和CyclicBarrier它们的行为有一定的相似度经常会被考察二者有什么区别我来简单总结一下。
* CountDownLatch是不可以重置的所以无法重用而CyclicBarrier则没有这种限制可以重用。
* CountDownLatch的基本操作组合是countDown/await。调用await的线程阻塞等待countDown足够的次数不管你是在一个线程还是多个线程里countDown只要次数足够即可。所以就像Brain Goetz说过的CountDownLatch操作的是事件。
* CyclicBarrier的基本操作组合则就是await当所有的伙伴parties都调用了await才会继续进行任务并自动进行重置。**注意**正常情况下CyclicBarrier的重置都是自动发生的如果我们调用reset方法但还有线程在等待就会导致等待线程被打扰抛出BrokenBarrierException异常。CyclicBarrier侧重点是线程而不是调用事件它的典型应用场景是用来等待并发线程结束。
如果用CountDownLatch去实现上面的排队场景该怎么做呢假设有10个人排队我们将其分成5个人一批通过CountDownLatch来协调批次你可以试试下面的示例代码。
```
import java.util.concurrent.CountDownLatch;
public class LatchSample {
public static void main(String[] args) throws InterruptedException {
    CountDownLatch latch = new CountDownLatch(6);
          for (int i = 0; i < 5; i++) {
               Thread t = new Thread(new FirstBatchWorker(latch));
               t.start();
    }
    for (int i = 0; i < 5; i++) {
           Thread t = new Thread(new SecondBatchWorker(latch));
           t.start();
    }
          // 注意这里也是演示目的的逻辑,并不是推荐的协调方式
    while ( latch.getCount() != 1 ){
           Thread.sleep(100L);
    }
    System.out.println("Wait for first batch finish");
    latch.countDown();
}
}
class FirstBatchWorker implements Runnable {
private CountDownLatch latch;
public FirstBatchWorker(CountDownLatch latch) {
    this.latch = latch;
}
@Override
public void run() {
        System.out.println("First batch executed!");
        latch.countDown();
}
}
class SecondBatchWorker implements Runnable {
private CountDownLatch latch;
public SecondBatchWorker(CountDownLatch latch) {
    this.latch = latch;
}
@Override
public void run() {
    try {
        latch.await();
        System.out.println("Second batch executed!");
    } catch (InterruptedException e) {
        e.printStackTrace();
    }
}
}
```
CountDownLatch的调度方式相对简单后一批次的线程进行await等待前一批countDown足够多次。这个例子也从侧面体现出了它的局限性虽然它也能够支持10个人排队的情况但是因为不能重用如果要支持更多人排队就不能依赖一个CountDownLatch进行了。其编译运行输出如下
![](https://static001.geekbang.org/resource/image/46/b9/46c88c7d8e0507465bddb677e4eac5b9.png)
在实际应用中的条件依赖往往没有这么别扭CountDownLatch用于线程间等待操作结束是非常简单普遍的用法。通过countDown/await组合进行通信是很高效的通常不建议使用例子里那个循环等待方式。
如果用CyclicBarrier来表达这个场景呢我们知道CyclicBarrier其实反映的是线程并行运行时的协调在下面的示例里从逻辑上5个工作线程其实更像是代表了5个可以就绪的空车而不再是5个乘客对比前面CountDownLatch的例子更有助于我们区别它们的抽象模型请看下面的示例代码
```
import java.util.concurrent.BrokenBarrierException;
import java.util.concurrent.CyclicBarrier;
public class CyclicBarrierSample {
public static void main(String[] args) throws InterruptedException {
    CyclicBarrier barrier = new CyclicBarrier(5, new Runnable() {
        @Override
        public void run() {
            System.out.println("Action...GO again!");
        }
    });
    for (int i = 0; i < 5; i++) {
        Thread t = new Thread(new CyclicWorker(barrier));
        t.start();
    }
}
static class CyclicWorker implements Runnable {
    private CyclicBarrier barrier;
    public CyclicWorker(CyclicBarrier barrier) {
        this.barrier = barrier;
    }
    @Override
    public void run() {
        try {
            for (int i=0; i<3 ; i++){
                System.out.println("Executed!");
                barrier.await();
            }
        } catch (BrokenBarrierException e) {
            e.printStackTrace();
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
  }
}
}
```
为了让输出更能表达运行时序我使用了CyclicBarrier特有的barrierAction当屏障被触发时Java会自动调度该动作。因为CyclicBarrier会**自动**进行重置,所以这个逻辑其实可以非常自然的支持更多排队人数。其编译输出如下:
![](https://static001.geekbang.org/resource/image/ef/9f/eff56d3219ce5493ecacc70a168b2b9f.png)
Java并发类库还提供了[Phaser](https://docs.oracle.com/javase/9/docs/api/java/util/concurrent/Phaser.html)功能与CountDownLatch很接近但是它允许线程动态地注册到Phaser上面而CountDownLatch显然是不能动态设置的。Phaser的设计初衷是实现多个线程类似步骤、阶段场景的协调线程注册等待屏障条件触发进而协调彼此间行动具体请参考这个[例子](http://www.baeldung.com/java-phaser)。
接下来我来梳理下并发包里提供的线程安全Map、List和Set。首先请参考下面的类图。
![](https://static001.geekbang.org/resource/image/35/57/35390aa8a6e6f9c92fda086a1b95b457.png)
你可以看到总体上种类和结构还是比较简单的如果我们的应用侧重于Map放入或者获取的速度而不在乎顺序大多推荐使用ConcurrentHashMap反之则使用ConcurrentSkipListMap如果我们需要对大量数据进行非常频繁地修改ConcurrentSkipListMap也可能表现出优势。
我在前面的专栏谈到了普通无顺序场景选择HashMap有顺序场景则可以选择类似TreeMap等但是为什么并发容器里面没有ConcurrentTreeMap呢
这是因为TreeMap要实现高效的线程安全是非常困难的它的实现基于复杂的红黑树。为保证访问效率当我们插入或删除节点时会移动节点进行平衡操作这导致在并发场景中难以进行合理粒度的同步。而SkipList结构则要相对简单很多通过层次结构提高访问速度虽然不够紧凑空间使用有一定提高O(nlogn)但是在增删元素时线程安全的开销要好很多。为了方便你理解SkipList的内部结构我画了一个示意图。
![](https://static001.geekbang.org/resource/image/63/7b/63b94b5b1d002bb191c75d2c48af767b.png)
关于两个CopyOnWrite容器其实CopyOnWriteArraySet是通过包装了CopyOnWriteArrayList来实现的所以在学习时我们可以专注于理解一种。
首先CopyOnWrite到底是什么意思呢它的原理是任何修改操作如add、set、remove都会拷贝原数组修改后替换原来的数组通过这种防御性的方式实现另类的线程安全。请看下面的代码片段我进行注释的地方可以清晰地理解其逻辑。
```
public boolean add(E e) {
synchronized (lock) {
    Object[] elements = getArray();
    int len = elements.length;
          // 拷贝
    Object[] newElements = Arrays.copyOf(elements, len + 1);
    newElements[len] = e;
          // 替换
    setArray(newElements);
    return true;
           }
}
final void setArray(Object[] a) {
array = a;
}
```
所以这种数据结构,相对比较适合读多写少的操作,不然修改的开销还是非常明显的。
今天我对Java并发包进行了总结并且结合实例分析了各种同步结构和部分线程安全容器希望对你有所帮助。
## 一课一练
关于今天我们讨论的题目你做到心中有数了吗留给你的思考题是你使用过类似CountDownLatch的同步结构解决实际问题吗谈谈你的使用场景和心得。
请你在留言区写写你对这个问题的思考,我会选出经过认真思考的留言,送给你一份学习奖励礼券,欢迎你与我一起讨论。
你的朋友是不是也在准备面试呢?你可以“请朋友读”,把今天的题目分享给好友,或许你能帮到他。