You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

524 lines
25 KiB
Markdown

2 years ago
# 31 | 加餐1带你吃透课程中Java 8的那些重要知识点
你好,我是朱晔。
Java 8是目前最常用的JDK版本在增强代码可读性、简化代码方面相比Java 7增加了很多功能比如Lambda、Stream流操作、并行流ParallelStream、Optional可空类型、新日期时间类型等。
这个课程中的所有案例都充分使用了Java 8的各种特性来简化代码。这也就意味着如果你不了解这些特性的话理解课程内的Demo可能会有些困难。因此我将这些特性单独拎了出来组成了两篇加餐。由于后面有单独一节课去讲Java 8的日期时间类型所以这里就不赘述了。
## 如何在项目中用上Lambda表达式和Stream操作
Java 8的特性有很多除了这两篇加餐外我再给你推荐一本全面介绍Java 8的书叫《Java实战第二版》。此外有同学在留言区问怎么把Lambda表达式和Stream操作运用到项目中。其实业务代码中可以使用这些特性的地方有很多。
这里,为了帮助你学习,并把这些特性用到业务开发中,我有三个小建议。
第一从List的操作开始先尝试把遍历List来筛选数据和转换数据的操作使用Stream的filter和map实现这是Stream最常用、最基本的两个API。你可以重点看看接下来两节的内容来入门。
第二使用高级的IDE来写代码以此找到可以利用Java 8语言特性简化代码的地方。比如对于IDEA我们可以把匿名类型使用Lambda替换的检测规则设置为Error级别严重程度
![](https://static001.geekbang.org/resource/image/67/77/6707ccf4415c2d8715ed2529cfdec877.png)
这样运行IDEA的Inspect Code的功能可以在Error级别的错误中看到这个问题引起更多关注帮助我们建立使用Lambda表达式的习惯
![](https://static001.geekbang.org/resource/image/50/e4/5062b3ef6ec57ccde0f3f4b182811be4.png)
第三如果你不知道如何把匿名类转换为Lambda表达式可以借助IDE来重构
![](https://static001.geekbang.org/resource/image/5a/e7/5a55c4284e4b10f659b7bcf0129cbde7.png)
反过来如果你在学习课程内案例时如果感觉阅读Lambda表达式和Stream API比较吃力同样可以借助IDE把Java 8的写法转换为使用循环的写法
![](https://static001.geekbang.org/resource/image/98/8a/98828a36d6bb7b7972a647b37a64f08a.png)
或者是把Lambda表达式替换为匿名类
![](https://static001.geekbang.org/resource/image/ee/7c/ee9401683b19e57462cb2574c285d67c.png)
## Lambda表达式
Lambda表达式的初衷是进一步简化匿名类的语法不过实现上Lambda表达式并不是匿名类的语法糖使Java走向函数式编程。对于匿名类虽然没有类名但还是要给出方法定义。这里有个例子分别使用匿名类和Lambda表达式创建一个线程打印字符串
```
//匿名类
new Thread(new Runnable(){
@Override
public void run(){
System.out.println("hello1");
}
}).start();
//Lambda表达式
new Thread(() -> System.out.println("hello2")).start();
```
那么Lambda表达式如何匹配Java的类型系统呢
答案就是,函数式接口。
函数式接口是一种只有单一抽象方法的接口,使用@FunctionalInterface来描述可以隐式地转换成 Lambda 表达式。使用Lambda表达式来实现函数式接口不需要提供类名和方法定义通过一行代码提供函数式接口的实例就可以让函数成为程序中的头等公民可以像普通数据一样作为参数传递而不是作为一个固定的类中的固定方法。
函数式接口到底是什么样的呢java.util.function包中定义了各种函数式接口。比如用于提供数据的Supplier接口就只有一个get抽象方法没有任何入参、有一个返回值
```
@FunctionalInterface
public interface Supplier<T> {
/**
* Gets a result.
*
* @return a result
*/
T get();
}
```
我们可以使用Lambda表达式或方法引用来得到Supplier接口的实例
```
//使用Lambda表达式提供Supplier接口实现返回OK字符串
Supplier<String> stringSupplier = ()->"OK";
//使用方法引用提供Supplier接口实现返回空字符串
Supplier<String> supplier = String::new;
```
这样是不是很方便为了帮你掌握函数式接口及其用法我再举几个使用Lambda表达式或方法引用来构建函数的例子
```
//Predicate接口是输入一个参数返回布尔值。我们通过and方法组合两个Predicate条件判断是否值大于0并且是偶数
Predicate<Integer> positiveNumber = i -> i > 0;
Predicate<Integer> evenNumber = i -> i % 2 == 0;
assertTrue(positiveNumber.and(evenNumber).test(2));
//Consumer接口是消费一个数据。我们通过andThen方法组合调用两个Consumer输出两行abcdefg
Consumer<String> println = System.out::println;
println.andThen(println).accept("abcdefg");
//Function接口是输入一个数据计算后输出一个数据。我们先把字符串转换为大写然后通过andThen组合另一个Function实现字符串拼接
Function<String, String> upperCase = String::toUpperCase;
Function<String, String> duplicate = s -> s.concat(s);
assertThat(upperCase.andThen(duplicate).apply("test"), is("TESTTEST"));
//Supplier是提供一个数据的接口。这里我们实现获取一个随机数
Supplier<Integer> random = ()->ThreadLocalRandom.current().nextInt();
System.out.println(random.get());
//BinaryOperator是输入两个同类型参数输出一个同类型参数的接口。这里我们通过方法引用获得一个整数加法操作通过Lambda表达式定义一个减法操作然后依次调用
BinaryOperator<Integer> add = Integer::sum;
BinaryOperator<Integer> subtraction = (a, b) -> a - b;
assertThat(subtraction.apply(add.apply(1, 2), 3), is(0));
```
Predicate、Function等函数式接口还使用default关键字实现了几个默认方法。这样一来它们既可以满足函数式接口只有一个抽象方法又能为接口提供额外的功能
```
@FunctionalInterface
public interface Function<T, R> {
R apply(T t);
default <V> Function<V, R> compose(Function<? super V, ? extends T> before) {
Objects.requireNonNull(before);
return (V v) -> apply(before.apply(v));
}
default <V> Function<T, V> andThen(Function<? super R, ? extends V> after) {
Objects.requireNonNull(after);
return (T t) -> after.apply(apply(t));
}
}
```
很明显Lambda表达式给了我们复用代码的更多可能性我们可以把一大段逻辑中变化的部分抽象出函数式接口由外部方法提供函数实现重用方法内的整体逻辑处理。
不过需要注意的是,在自定义函数式接口之前,可以先确认下[java.util.function包](https://docs.oracle.com/javase/8/docs/api/java/util/function/package-summary.html)中的43个标准函数式接口是否能满足需求我们要尽可能重用这些接口因为使用大家熟悉的标准接口可以提高代码的可读性。
## 使用Java 8简化代码
这一部分我会通过几个具体的例子带你感受一下使用Java 8简化代码的三个重要方面
* 使用Stream简化集合操作
* 使用Optional简化判空逻辑
* JDK8结合Lambda和Stream对各种类的增强。
### 使用Stream简化集合操作
Lambda表达式可以帮我们用简短的代码实现方法的定义给了我们复用代码的更多可能性。利用这个特性我们可以把集合的投影、转换、过滤等操作抽象成通用的接口然后通过Lambda表达式传入其具体实现这也就是Stream操作。
我们看一个具体的例子。这里有一段20行左右的代码实现了如下的逻辑
* 把整数列表转换为Point2D列表
* 遍历Point2D列表过滤出Y轴>1的对象
* 计算Point2D点到原点的距离
* 累加所有计算出的距离,并计算距离的平均值。
```
private static double calc(List<Integer> ints) {
//临时中间集合
List<Point2D> point2DList = new ArrayList<>();
for (Integer i : ints) {
point2DList.add(new Point2D.Double((double) i % 3, (double) i / 3));
}
//临时变量,纯粹是为了获得最后结果需要的中间变量
double total = 0;
int count = 0;
for (Point2D point2D : point2DList) {
//过滤
if (point2D.getY() > 1) {
//算距离
double distance = point2D.distance(0, 0);
total += distance;
count++;
}
}
//注意count可能为0的可能
return count >0 ? total / count : 0;
}
```
现在我们可以使用Stream配合Lambda表达式来简化这段代码。简化后一行代码就可以实现这样的逻辑更重要的是代码可读性更强了通过方法名就可以知晓大概是在做什么事情。比如
* map方法传入的是一个Function可以实现对象转换
* filter方法传入一个Predicate实现对象的布尔判断只保留返回true的数据
* mapToDouble用于把对象转换为double
* 通过average方法返回一个OptionalDouble代表可能包含值也可能不包含值的可空double。
下面的第三行代码,就实现了上面方法的所有工作:
```
List<Integer> ints = Arrays.asList(1, 2, 3, 4, 5, 6, 7, 8);
double average = calc(ints);
double streamResult = ints.stream()
.map(i -> new Point2D.Double((double) i % 3, (double) i / 3))
.filter(point -> point.getY() > 1)
.mapToDouble(point -> point.distance(0, 0))
.average()
.orElse(0);
//如何用一行代码来实现,比较一下可读性
assertThat(average, is(streamResult));
```
到这里你可能会问了OptionalDouble又是怎么回事儿
### 有关Optional可空类型
其实类似OptionalDouble、OptionalInt、OptionalLong等是服务于基本类型的可空对象。此外Java8还定义了用于引用类型的Optional类。使用Optional不仅可以避免使用Stream进行级联调用的空指针问题更重要的是它提供了一些实用的方法帮我们避免判空逻辑。
如下是一些例子演示了如何使用Optional来避免空指针以及如何使用它的fluent API简化冗长的if-else判空逻辑
```
@Test(expected = IllegalArgumentException.class)
public void optional() {
//通过get方法获取Optional中的实际值
assertThat(Optional.of(1).get(), is(1));
//通过ofNullable来初始化一个null通过orElse方法实现Optional中无数据的时候返回一个默认值
assertThat(Optional.ofNullable(null).orElse("A"), is("A"));
//OptionalDouble是基本类型double的Optional对象isPresent判断有无数据
assertFalse(OptionalDouble.empty().isPresent());
//通过map方法可以对Optional对象进行级联转换不会出现空指针转换后还是一个Optional
assertThat(Optional.of(1).map(Math::incrementExact).get(), is(2));
//通过filter实现Optional中数据的过滤得到一个Optional然后级联使用orElse提供默认值
assertThat(Optional.of(1).filter(integer -> integer % 2 == 0).orElse(null), is(nullValue()));
//通过orElseThrow实现无数据时抛出异常
Optional.empty().orElseThrow(IllegalArgumentException::new);
}
```
我把Optional类的常用方法整理成了一张图你可以对照案例再复习一下
![](https://static001.geekbang.org/resource/image/c8/52/c8a901bb16b9fca07ae0fc8bb222b252.jpg)
### Java 8类对于函数式API的增强
除了Stream之外Java 8中有很多类也都实现了函数式的功能。
比如要通过HashMap实现一个缓存的操作在Java 8之前我们可能会写出这样的getProductAndCache方法先判断缓存中是否有值如果没有值就从数据库搜索取值最后把数据加入缓存。
```
private Map<Long, Product> cache = new ConcurrentHashMap<>();
private Product getProductAndCache(Long id) {
Product product = null;
//Key存在返回Value
if (cache.containsKey(id)) {
product = cache.get(id);
} else {
//不存在则获取Value
//需要遍历数据源查询获得Product
for (Product p : Product.getData()) {
if (p.getId().equals(id)) {
product = p;
break;
}
}
//加入ConcurrentHashMap
if (product != null)
cache.put(id, product);
}
return product;
}
@Test
public void notcoolCache() {
getProductAndCache(1L);
getProductAndCache(100L);
System.out.println(cache);
assertThat(cache.size(), is(1));
assertTrue(cache.containsKey(1L));
}
```
而在Java 8中我们利用ConcurrentHashMap的computeIfAbsent方法用一行代码就可以实现这样的繁琐操作
```
private Product getProductAndCacheCool(Long id) {
return cache.computeIfAbsent(id, i -> //当Key不存在的时候提供一个Function来代表根据Key获取Value的过程
Product.getData().stream()
.filter(p -> p.getId().equals(i)) //过滤
.findFirst() //找第一个得到Optional<Product>
.orElse(null)); //如果找不到Product则使用null
}
@Test
public void coolCache()
{
getProductAndCacheCool(1L);
getProductAndCacheCool(100L);
System.out.println(cache);
assertThat(cache.size(), is(1));
assertTrue(cache.containsKey(1L));
}
```
computeIfAbsent方法在逻辑上相当于
```
if (map.get(key) == null) {
V newValue = mappingFunction.apply(key);
if (newValue != null)
map.put(key, newValue);
}
```
又比如利用Files.walk返回一个Path的流通过两行代码就能实现递归搜索+grep的操作。整个逻辑是递归搜索文件夹查找所有的.java文件然后读取文件每一行内容用正则表达式匹配public class关键字最后输出文件名和这行内容。
```
@Test
public void filesExample() throws IOException {
//无限深度,递归遍历文件夹
try (Stream<Path> pathStream = Files.walk(Paths.get("."))) {
pathStream.filter(Files::isRegularFile) //只查普通文件
.filter(FileSystems.getDefault().getPathMatcher("glob:**/*.java")::matches) //搜索java源码文件
.flatMap(ThrowingFunction.unchecked(path ->
Files.readAllLines(path).stream() //读取文件内容转换为Stream<List>
.filter(line -> Pattern.compile("public class").matcher(line).find()) //使用正则过滤带有public class的行
.map(line -> path.getFileName() + " >> " + line))) //把这行文件内容转换为文件名+行
.forEach(System.out::println); //打印所有的行
}
}
```
输出结果如下:
![](https://static001.geekbang.org/resource/image/84/12/84349a90ef4aaf30032d0a8f64ab4512.png)
我再和你分享一个小技巧吧。因为Files.readAllLines方法会抛出一个受检异常IOException所以我使用了一个自定义的函数式接口用ThrowingFunction包装这个方法把受检异常转换为运行时异常让代码更清晰
```
@FunctionalInterface
public interface ThrowingFunction<T, R, E extends Throwable> {
static <T, R, E extends Throwable> Function<T, R> unchecked(ThrowingFunction<T, R, E> f) {
return t -> {
try {
return f.apply(t);
} catch (Throwable e) {
throw new RuntimeException(e);
}
};
}
R apply(T t) throws E;
}
```
如果用Java 7实现类似逻辑的话大概需要几十行代码你可以尝试下。
## 并行流
前面我们看到的Stream操作都是串行Stream操作只是在一个线程中执行此外Java 8还提供了并行流的功能通过parallel方法一键把Stream转换为并行操作提交到线程池处理。
比如如下代码通过线程池来并行消费处理1到100
```
IntStream.rangeClosed(1,100).parallel().forEach(i->{
System.out.println(LocalDateTime.now() + " : " + i);
try {
Thread.sleep(1000);
} catch (InterruptedException e) { }
});
```
并行流不确保执行顺序并且因为每次处理耗时1秒所以可以看到在8核机器上数组是按照8个一组1秒输出一次
![](https://static001.geekbang.org/resource/image/f1/d6/f114d98aa2530c3f7e91b06aaa4ee1d6.png)
在这个课程中有很多类似使用threadCount个线程对某个方法总计执行taskCount次操作的案例用于演示并发情况下的多线程问题或多线程处理性能。除了会用到并行流我们有时也会使用线程池或直接使用线程进行类似操作。为了方便你对比各种实现这里我一次性给出实现此类操作的五种方式。
为了测试这五种实现方式我们设计一个场景使用20个线程threadCount以并行方式总计执行10000次taskCount操作。因为单个任务单线程执行需要10毫秒任务代码如下也就是每秒吞吐量是100个操作那20个线程QPS是2000执行完10000次操作最少耗时5秒。
```
private void increment(AtomicInteger atomicInteger) {
atomicInteger.incrementAndGet();
try {
TimeUnit.MILLISECONDS.sleep(10);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
```
现在我们测试一下这五种方式,是否都可以利用更多的线程并行执行操作。
第一种方式是使用线程。直接把任务按照线程数均匀分割分配到不同的线程执行使用CountDownLatch来阻塞主线程直到所有线程都完成操作。这种方式需要我们自己分割任务
```
private int thread(int taskCount, int threadCount) throws InterruptedException {
//总操作次数计数器
AtomicInteger atomicInteger = new AtomicInteger();
//使用CountDownLatch来等待所有线程执行完成
CountDownLatch countDownLatch = new CountDownLatch(threadCount);
//使用IntStream把数字直接转为Thread
IntStream.rangeClosed(1, threadCount).mapToObj(i -> new Thread(() -> {
//手动把taskCount分成taskCount份每一份有一个线程执行
IntStream.rangeClosed(1, taskCount / threadCount).forEach(j -> increment(atomicInteger));
//每一个线程处理完成自己那部分数据之后countDown一次
countDownLatch.countDown();
})).forEach(Thread::start);
//等到所有线程执行完成
countDownLatch.await();
//查询计数器当前值
return atomicInteger.get();
}
```
第二种方式是使用Executors.newFixedThreadPool来获得固定线程数的线程池使用execute提交所有任务到线程池执行最后关闭线程池等待所有任务执行完成
```
private int threadpool(int taskCount, int threadCount) throws InterruptedException {
//总操作次数计数器
AtomicInteger atomicInteger = new AtomicInteger();
//初始化一个线程数量=threadCount的线程池
ExecutorService executorService = Executors.newFixedThreadPool(threadCount);
//所有任务直接提交到线程池处理
IntStream.rangeClosed(1, taskCount).forEach(i -> executorService.execute(() -> increment(atomicInteger)));
//提交关闭线程池申请,等待之前所有任务执行完成
executorService.shutdown();
executorService.awaitTermination(1, TimeUnit.HOURS);
//查询计数器当前值
return atomicInteger.get();
}
```
第三种方式是使用ForkJoinPool而不是普通线程池执行任务。
ForkJoinPool和传统的ThreadPoolExecutor区别在于前者对于n并行度有n个独立队列后者是共享队列。如果有大量执行耗时比较短的任务ThreadPoolExecutor的单队列就可能会成为瓶颈。这时使用ForkJoinPool性能会更好。
因此ForkJoinPool更适合大任务分割成许多小任务并行执行的场景而ThreadPoolExecutor适合许多独立任务并发执行的场景。
在这里我们先自定义一个具有指定并行数的ForkJoinPool再通过这个ForkJoinPool并行执行操作
```
private int forkjoin(int taskCount, int threadCount) throws InterruptedException {
//总操作次数计数器
AtomicInteger atomicInteger = new AtomicInteger();
//自定义一个并行度=threadCount的ForkJoinPool
ForkJoinPool forkJoinPool = new ForkJoinPool(threadCount);
//所有任务直接提交到线程池处理
forkJoinPool.execute(() -> IntStream.rangeClosed(1, taskCount).parallel().forEach(i -> increment(atomicInteger)));
//提交关闭线程池申请,等待之前所有任务执行完成
forkJoinPool.shutdown();
forkJoinPool.awaitTermination(1, TimeUnit.HOURS);
//查询计数器当前值
return atomicInteger.get();
}
```
第四种方式是直接使用并行流并行流使用公共的ForkJoinPool也就是ForkJoinPool.commonPool()。
公共的ForkJoinPool默认的并行度是CPU核心数-1原因是对于CPU绑定的任务分配超过CPU个数的线程没有意义。由于并行流还会使用主线程执行任务也会占用一个CPU核心所以公共ForkJoinPool的并行度即使-1也能用满所有CPU核心。
这里我们通过配置强制指定增大了并行数但因为使用的是公共ForkJoinPool所以可能会存在干扰你可以回顾下[第3讲](https://time.geekbang.org/column/article/210337)有关线程池混用产生的问题:
```
private int stream(int taskCount, int threadCount) {
//设置公共ForkJoinPool的并行度
System.setProperty("java.util.concurrent.ForkJoinPool.common.parallelism", String.valueOf(threadCount));
//总操作次数计数器
AtomicInteger atomicInteger = new AtomicInteger();
//由于我们设置了公共ForkJoinPool的并行度直接使用parallel提交任务即可
IntStream.rangeClosed(1, taskCount).parallel().forEach(i -> increment(atomicInteger));
//查询计数器当前值
return atomicInteger.get();
}
```
第五种方式是使用CompletableFuture来实现。CompletableFuture.runAsync方法可以指定一个线程池一般会在使用CompletableFuture的时候用到
```
private int completableFuture(int taskCount, int threadCount) throws InterruptedException, ExecutionException {
//总操作次数计数器
AtomicInteger atomicInteger = new AtomicInteger();
//自定义一个并行度=threadCount的ForkJoinPool
ForkJoinPool forkJoinPool = new ForkJoinPool(threadCount);
//使用CompletableFuture.runAsync通过指定线程池异步执行任务
CompletableFuture.runAsync(() -> IntStream.rangeClosed(1, taskCount).parallel().forEach(i -> increment(atomicInteger)), forkJoinPool).get();
//查询计数器当前值
return atomicInteger.get();
}
```
上面这五种方法都可以实现类似的效果:
![](https://static001.geekbang.org/resource/image/77/cc/77c42149013fd82c18d39b5e0d0292cc.png)
可以看到这5种方式执行完10000个任务的耗时都在5.4秒到6秒之间。这里的结果只是证明并行度的设置是有效的并不是性能比较。
如果你的程序对性能要求特别敏感建议通过性能测试根据场景决定适合的模式。一般而言使用线程池第二种和直接使用并行流第四种的方式在业务代码中比较常用。但需要注意的是我们通常会重用线程池而不会像Demo中那样在业务逻辑中直接声明新的线程池等操作完成后再关闭。
**另外需要注意的是在上面的例子中我们一定是先运行stream方法再运行forkjoin方法对公共ForkJoinPool默认并行度的修改才能生效。**
这是因为ForkJoinPool类初始化公共线程池是在静态代码块里加载类时就会进行的如果forkjoin方法中先使用了ForkJoinPool即便stream方法中设置了系统属性也不会起作用。因此我的建议是设置ForkJoinPool公共线程池默认并行度的操作应该放在应用启动时设置。
## 重点回顾
今天我和你简单介绍了Java 8中最重要的几个功能包括Lambda表达式、Stream流式操作、Optional可空对象、并行流操作。这些特性可以帮助我们写出简单易懂、可读性更强的代码。特别是使用Stream的链式方法可以用一行代码完成之前几十行代码的工作。
因为Stream的API非常多使用方法也是千变万化因此我会在下一讲和你详细介绍Stream API的一些使用细节。
今天用到的代码我都放在了GitHub上你可以点击[这个链接](https://github.com/JosephZhu1983/java-common-mistakes)查看。
## 思考与讨论
1. 检查下代码中是否有使用匿名类以及通过遍历List进行数据过滤、转换和聚合的代码看看能否使用Lambda表达式和Stream来重新实现呢
2. 对于并行流部分的并行消费处理1到100的例子如果把forEach替换为forEachOrdered你觉得会发生什么呢
关于Java 8你还有什么使用心得吗我是朱晔欢迎在评论区与我留言分享你的想法也欢迎你把这篇文章分享给你的朋友或同事一起交流。