You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

420 lines
21 KiB
Markdown

2 years ago
# 32 | 加餐2带你吃透课程中Java 8的那些重要知识点
你好,我是朱晔。
上一讲的几个例子中其实都涉及了Stream API的最基本使用方法。今天我会与你详细介绍复杂、功能强大的Stream API。
Stream流式操作用于对集合进行投影、转换、过滤、排序等更进一步地这些操作能链式串联在一起使用类似于SQL语句可以大大简化代码。可以说Stream操作是Java 8中最重要的内容也是这个课程大部分代码都会用到的操作。
我先说明下有些案例可能不太好理解建议你对着代码逐一到源码中查看Stream操作的方法定义以及JDK中的代码注释。
## Stream操作详解
为了方便你理解Stream的各种操作以及后面的案例我先把这节课涉及的Stream操作汇总到了一张图中。你可以先熟悉一下。
![](https://static001.geekbang.org/resource/image/44/04/44a6f4cb8b413ef62c40a272cb474104.jpg)
在接下来的讲述中我会围绕订单场景给出如何使用Stream的各种API完成订单的统计、搜索、查询等功能和你一起学习Stream流式操作的各种方法。你可以结合代码中的注释理解案例也可以自己运行源码观察输出。
我们先定义一个订单类、一个订单商品类和一个顾客类用作后续Demo代码的数据结构
```
//订单类
@Data
public class Order {
private Long id;
private Long customerId;//顾客ID
private String customerName;//顾客姓名
private List<OrderItem> orderItemList;//订单商品明细
private Double totalPrice;//总价格
private LocalDateTime placedAt;//下单时间
}
//订单商品类
@Data
@AllArgsConstructor
@NoArgsConstructor
public class OrderItem {
private Long productId;//商品ID
private String productName;//商品名称
private Double productPrice;//商品价格
private Integer productQuantity;//商品数量
}
//顾客类
@Data
@AllArgsConstructor
public class Customer {
private Long id;
private String name;//顾客姓名
}
```
在这里我们有一个orders字段保存了一些模拟数据类型是List。这里我就不贴出生成模拟数据的代码了。这不会影响你理解后面的代码你也可以自己下载源码阅读。
### 创建流
要使用流,就要先创建流。创建流一般有五种方式:
* 通过stream方法把List或数组转换为流
* 通过Stream.of方法直接传入多个元素构成一个流
* 通过Stream.iterate方法使用迭代的方式构造一个无限流然后使用limit限制流元素个数
* 通过Stream.generate方法从外部传入一个提供元素的Supplier来构造无限流然后使用limit限制流元素个数
* 通过IntStream或DoubleStream构造基本类型的流。
```
//通过stream方法把List或数组转换为流
@Test
public void stream()
{
Arrays.asList("a1", "a2", "a3").stream().forEach(System.out::println);
Arrays.stream(new int[]{1, 2, 3}).forEach(System.out::println);
}
//通过Stream.of方法直接传入多个元素构成一个流
@Test
public void of()
{
String[] arr = {"a", "b", "c"};
Stream.of(arr).forEach(System.out::println);
Stream.of("a", "b", "c").forEach(System.out::println);
Stream.of(1, 2, "a").map(item -> item.getClass().getName()).forEach(System.out::println);
}
//通过Stream.iterate方法使用迭代的方式构造一个无限流然后使用limit限制流元素个数
@Test
public void iterate()
{
Stream.iterate(2, item -> item * 2).limit(10).forEach(System.out::println);
Stream.iterate(BigInteger.ZERO, n -> n.add(BigInteger.TEN)).limit(10).forEach(System.out::println);
}
//通过Stream.generate方法从外部传入一个提供元素的Supplier来构造无限流然后使用limit限制流元素个数
@Test
public void generate()
{
Stream.generate(() -> "test").limit(3).forEach(System.out::println);
Stream.generate(Math::random).limit(10).forEach(System.out::println);
}
//通过IntStream或DoubleStream构造基本类型的流
@Test
public void primitive()
{
//演示IntStream和DoubleStream
IntStream.range(1, 3).forEach(System.out::println);
IntStream.range(0, 3).mapToObj(i -> "x").forEach(System.out::println);
IntStream.rangeClosed(1, 3).forEach(System.out::println);
DoubleStream.of(1.1, 2.2, 3.3).forEach(System.out::println);
//各种转换,后面注释代表了输出结果
System.out.println(IntStream.of(1, 2).toArray().getClass()); //class [I
System.out.println(Stream.of(1, 2).mapToInt(Integer::intValue).toArray().getClass()); //class [I
System.out.println(IntStream.of(1, 2).boxed().toArray().getClass()); //class [Ljava.lang.Object;
System.out.println(IntStream.of(1, 2).asDoubleStream().toArray().getClass()); //class [D
System.out.println(IntStream.of(1, 2).asLongStream().toArray().getClass()); //class [J
//注意基本类型流和装箱后的流的区别
Arrays.asList("a", "b", "c").stream() // Stream<String>
.mapToInt(String::length) // IntStream
.asLongStream() // LongStream
.mapToDouble(x -> x / 10.0) // DoubleStream
.boxed() // Stream<Double>
.mapToLong(x -> 1L) // LongStream
.mapToObj(x -> "") // Stream<String>
.collect(Collectors.toList());
}
```
### filter
filter方法可以实现过滤操作类似SQL中的where。我们可以使用一行代码通过filter方法实现查询所有订单中最近半年金额大于40的订单通过连续叠加filter方法进行多次条件过滤
```
//最近半年的金额大于40的订单
orders.stream()
.filter(Objects::nonNull) //过滤null值
.filter(order -> order.getPlacedAt().isAfter(LocalDateTime.now().minusMonths(6))) //最近半年的订单
.filter(order -> order.getTotalPrice() > 40) //金额大于40的订单
.forEach(System.out::println);
```
如果不使用Stream的话必然需要一个中间集合来收集过滤后的结果而且所有的过滤条件会堆积在一起代码冗长且不易读。
### map
map操作可以做转换或者说投影类似SQL中的select。为了对比我用两种方式统计订单中所有商品的数量前一种是通过两次遍历实现后一种是通过两次mapToLong+sum方法实现
```
//计算所有订单商品数量
//通过两次遍历实现
LongAdder longAdder = new LongAdder();
orders.stream().forEach(order ->
order.getOrderItemList().forEach(orderItem -> longAdder.add(orderItem.getProductQuantity())));
//使用两次mapToLong+sum方法实现
assertThat(longAdder.longValue(), is(orders.stream().mapToLong(order ->
order.getOrderItemList().stream()
.mapToLong(OrderItem::getProductQuantity).sum()).sum()));
```
显然后一种方式无需中间变量longAdder更直观。
这里再补充一下使用for循环生成数据是我们平时常用的操作也是这个课程会大量用到的。现在我们可以用一行代码使用IntStream配合mapToObj替代for循环来生成数据比如生成10个Product元素构成List
```
//把IntStream通过转换Stream<Project>
System.out.println(IntStream.rangeClosed(1,10)
.mapToObj(i->new Product((long)i, "product"+i, i*100.0))
.collect(toList()));
```
### flatMap
接下来我们看看flatMap展开或者叫扁平化操作相当于map+flat通过map把每一个元素替换为一个流然后展开这个流。
比如,我们要统计所有订单的总价格,可以有两种方式:
* 直接通过原始商品列表的商品个数\*商品单价统计的话可以先把订单通过flatMap展开成商品清单也就是把Order替换为Stream然后对每一个OrderItem用mapToDouble转换获得商品总价最后进行一次sum求和
* 利用flatMapToDouble方法把列表中每一项展开替换为一个DoubleStream也就是直接把每一个订单转换为每一个商品的总价然后求和。
```
//直接展开订单商品进行价格统计
System.out.println(orders.stream()
.flatMap(order -> order.getOrderItemList().stream())
.mapToDouble(item -> item.getProductQuantity() * item.getProductPrice()).sum());
//另一种方式flatMap+mapToDouble=flatMapToDouble
System.out.println(orders.stream()
.flatMapToDouble(order ->
order.getOrderItemList()
.stream().mapToDouble(item -> item.getProductQuantity() * item.getProductPrice()))
.sum());
```
这两种方式可以得到相同的结果,并无本质区别。
### sorted
sorted操作可以用于行内排序的场景类似SQL中的order by。比如要实现大于50元订单的按价格倒序取前5可以通过Order::getTotalPrice方法引用直接指定需要排序的依据字段通过reversed()实现倒序:
```
//大于50的订单,按照订单价格倒序前5
orders.stream().filter(order -> order.getTotalPrice() > 50)
.sorted(comparing(Order::getTotalPrice).reversed())
.limit(5)
.forEach(System.out::println);
```
### distinct
distinct操作的作用是去重类似SQL中的distinct。比如下面的代码实现
* 查询去重后的下单用户。使用map从订单提取出购买用户然后使用distinct去重。
* 查询购买过的商品名。使用flatMap+map提取出订单中所有的商品名然后使用distinct去重。
```
//去重的下单用户
System.out.println(orders.stream().map(order -> order.getCustomerName()).distinct().collect(joining(",")));
//所有购买过的商品
System.out.println(orders.stream()
.flatMap(order -> order.getOrderItemList().stream())
.map(OrderItem::getProductName)
.distinct().collect(joining(",")));
```
### skip & limit
skip和limit操作用于分页类似MySQL中的limit。其中skip实现跳过一定的项limit用于限制项总数。比如下面的两段代码
* 按照下单时间排序查询前2个订单的顾客姓名和下单时间
* 按照下单时间排序查询第3和第4个订单的顾客姓名和下单时间。
```
//按照下单时间排序查询前2个订单的顾客姓名和下单时间
orders.stream()
.sorted(comparing(Order::getPlacedAt))
.map(order -> order.getCustomerName() + "@" + order.getPlacedAt())
.limit(2).forEach(System.out::println);
//按照下单时间排序查询第3和第4个订单的顾客姓名和下单时间
orders.stream()
.sorted(comparing(Order::getPlacedAt))
.map(order -> order.getCustomerName() + "@" + order.getPlacedAt())
.skip(2).limit(2).forEach(System.out::println);
```
### collect
collect是收集操作对流进行终结终止操作把流导出为我们需要的数据结构。“终结”是指导出后无法再串联使用其他中间操作比如filter、map、flatmap、sorted、distinct、limit、skip。
在Stream操作中collect是最复杂的终结操作比较简单的终结操作还有forEach、toArray、min、max、count、anyMatch等我就不再展开了你可以查询[JDK文档](https://docs.oracle.com/javase/8/docs/api/java/util/stream/Stream.html)搜索terminal operation或intermediate operation。
接下来我通过6个案例来演示下几种比较常用的collect操作
* 第一个案例,实现了字符串拼接操作,生成一定位数的随机字符串。
* 第二个案例通过Collectors.toSet静态方法收集为Set去重得到去重后的下单用户再通过Collectors.joining静态方法实现字符串拼接。
* 第三个案例通过Collectors.toCollection静态方法获得指定类型的集合比如把List转换为LinkedList。
* 第四个案例通过Collectors.toMap静态方法将对象快速转换为MapKey是订单ID、Value是下单用户名。
* 第五个案例通过Collectors.toMap静态方法将对象转换为Map。Key是下单用户名Value是下单时间一个用户可能多次下单所以直接在这里进行了合并只获取最近一次的下单时间。
* 第六个案例使用Collectors.summingInt方法对商品数量求和再使用Collectors.averagingInt方法对结果求平均值以统计所有订单平均购买的商品数量。
```
//生成一定位数的随机字符串
System.out.println(random.ints(48, 122)
.filter(i -> (i < 57 || i > 65) && (i < 90 || i > 97))
.mapToObj(i -> (char) i)
.limit(20)
.collect(StringBuilder::new, StringBuilder::append, StringBuilder::append)
.toString());
//所有下单的用户使用toSet去重后实现字符串拼接
System.out.println(orders.stream()
.map(order -> order.getCustomerName()).collect(toSet())
.stream().collect(joining(",", "[", "]")));
//用toCollection收集器指定集合类型
System.out.println(orders.stream().limit(2).collect(toCollection(LinkedList::new)).getClass());
//使用toMap获取订单ID+下单用户名的Map
orders.stream()
.collect(toMap(Order::getId, Order::getCustomerName))
.entrySet().forEach(System.out::println);
//使用toMap获取下单用户名+最近一次下单时间的Map
orders.stream()
.collect(toMap(Order::getCustomerName, Order::getPlacedAt, (x, y) -> x.isAfter(y) ? x : y))
.entrySet().forEach(System.out::println);
//订单平均购买的商品数量
System.out.println(orders.stream().collect(averagingInt(order ->
order.getOrderItemList().stream()
.collect(summingInt(OrderItem::getProductQuantity)))));
```
可以看到这6个操作使用Stream方式一行代码就可以实现但使用非Stream方式实现的话都需要几行甚至十几行代码。
有关Collectors类的一些常用静态方法我总结到了一张图中你可以再整理一下思路
![](https://static001.geekbang.org/resource/image/5a/de/5af5ba60d7af2c8780b69bc6c71cf3de.png)
其中groupBy和partitionBy比较复杂我和你举例介绍。
### groupBy
groupBy是分组统计操作类似SQL中的group by子句。它和后面介绍的partitioningBy都是特殊的收集器同样也是终结操作。分组操作比较复杂为帮你理解得更透彻我准备了8个案例
* 第一个案例按照用户名分组使用Collectors.counting方法统计每个人的下单数量再按照下单数量倒序输出。
* 第二个案例按照用户名分组使用Collectors.summingDouble方法统计订单总金额再按总金额倒序输出。
* 第三个案例按照用户名分组使用两次Collectors.summingInt方法统计商品采购数量再按总数量倒序输出。
* 第四个案例统计被采购最多的商品。先通过flatMap把订单转换为商品然后把商品名作为Key、Collectors.summingInt作为Value分组统计采购数量再按Value倒序获取第一个Entry最后查询Key就得到了售出最多的商品。
* 第五个案例同样统计采购最多的商品。相比第四个案例排序Map的方式这次直接使用Collectors.maxBy收集器获得最大的Entry。
* 第六个案例按照用户名分组统计用户下的金额最高的订单。Key是用户名Value是Order直接通过Collectors.maxBy方法拿到金额最高的订单然后通过collectingAndThen实现Optional.get的内容提取最后遍历Key/Value即可。
* 第七个案例根据下单年月分组统计订单ID列表。Key是格式化成年月后的下单时间Value直接通过Collectors.mapping方法进行了转换把订单列表转换为订单ID构成的List。
* 第八个案例,根据下单年月+用户名两次分组统计订单ID列表相比上一个案例多了一次分组操作第二次分组是按照用户名进行分组。
```
//按照用户名分组,统计下单数量
System.out.println(orders.stream().collect(groupingBy(Order::getCustomerName, counting()))
.entrySet().stream().sorted(Map.Entry.<String, Long>comparingByValue().reversed()).collect(toList()));
//按照用户名分组,统计订单总金额
System.out.println(orders.stream().collect(groupingBy(Order::getCustomerName, summingDouble(Order::getTotalPrice)))
.entrySet().stream().sorted(Map.Entry.<String, Double>comparingByValue().reversed()).collect(toList()));
//按照用户名分组,统计商品采购数量
System.out.println(orders.stream().collect(groupingBy(Order::getCustomerName,
summingInt(order -> order.getOrderItemList().stream()
.collect(summingInt(OrderItem::getProductQuantity)))))
.entrySet().stream().sorted(Map.Entry.<String, Integer>comparingByValue().reversed()).collect(toList()));
//统计最受欢迎的商品,倒序后取第一个
orders.stream()
.flatMap(order -> order.getOrderItemList().stream())
.collect(groupingBy(OrderItem::getProductName, summingInt(OrderItem::getProductQuantity)))
.entrySet().stream()
.sorted(Map.Entry.<String, Integer>comparingByValue().reversed())
.map(Map.Entry::getKey)
.findFirst()
.ifPresent(System.out::println);
//统计最受欢迎的商品的另一种方式直接利用maxBy
orders.stream()
.flatMap(order -> order.getOrderItemList().stream())
.collect(groupingBy(OrderItem::getProductName, summingInt(OrderItem::getProductQuantity)))
.entrySet().stream()
.collect(maxBy(Map.Entry.comparingByValue()))
.map(Map.Entry::getKey)
.ifPresent(System.out::println);
//按照用户名分组,选用户下的总金额最大的订单
orders.stream().collect(groupingBy(Order::getCustomerName, collectingAndThen(maxBy(comparingDouble(Order::getTotalPrice)), Optional::get)))
.forEach((k, v) -> System.out.println(k + "#" + v.getTotalPrice() + "@" + v.getPlacedAt()));
//根据下单年月分组统计订单ID列表
System.out.println(orders.stream().collect
(groupingBy(order -> order.getPlacedAt().format(DateTimeFormatter.ofPattern("yyyyMM")),
mapping(order -> order.getId(), toList()))));
//根据下单年月+用户名两次分组统计订单ID列表
System.out.println(orders.stream().collect
(groupingBy(order -> order.getPlacedAt().format(DateTimeFormatter.ofPattern("yyyyMM")),
groupingBy(order -> order.getCustomerName(),
mapping(order -> order.getId(), toList())))));
```
如果不借助Stream转换为普通的Java代码实现这些复杂的操作可能需要几十行代码。
### partitionBy
partitioningBy用于分区分区是特殊的分组只有true和false两组。比如我们把用户按照是否下单进行分区给partitioningBy方法传入一个Predicate作为数据分区的区分输出是Map<Boolean, List<T>>
```
public static <T>
Collector<T, ?, Map<Boolean, List<T>>> partitioningBy(Predicate<? super T> predicate) {
return partitioningBy(predicate, toList());
}
```
测试一下partitioningBy配合anyMatch可以把用户分为下过订单和没下过订单两组
```
//根据是否有下单记录进行分区
System.out.println(Customer.getData().stream().collect(
partitioningBy(customer -> orders.stream().mapToLong(Order::getCustomerId)
.anyMatch(id -> id == customer.getId()))));
```
## 重点回顾
今天我用了大量的篇幅和案例和你展开介绍了Stream中很多具体的流式操作方法。有些案例可能不太好理解我建议你对着代码逐一到源码中查看这些操作的方法定义以及JDK中的代码注释。
最后我建议你思考下在日常工作中还会使用SQL统计哪些信息这些SQL是否也可以用Stream来改写呢Stream的API博大精深但其中又有规律可循。这其中的规律主要就是理清楚这些API传参的函数式接口定义就能搞明白到底是需要我们提供数据、消费数据、还是转换数据等。那掌握Stream的方法便是多测试多练习以强化记忆、加深理解。
今天用到的代码我都放在了GitHub上你可以点击[这个链接](https://github.com/JosephZhu1983/java-common-mistakes)查看。
## 思考与讨论
1. 使用Stream可以非常方便地对List做各种操作那有没有什么办法可以实现在整个过程中观察数据变化呢比如我们进行filter+map操作如何观察filter后map的原始数据呢
2. Collectors类提供了很多现成的收集器那我们有没有办法实现自定义的收集器呢比如实现一个MostPopularCollector来得到List中出现次数最多的元素满足下面两个测试用例
```
assertThat(Stream.of(1, 1, 2, 2, 2, 3, 4, 5, 5).collect(new MostPopularCollector<>()).get(), is(2));
assertThat(Stream.of('a', 'b', 'c', 'c', 'c', 'd').collect(new MostPopularCollector<>()).get(), is('c'));
```
关于Java 8你还有什么使用心得吗我是朱晔欢迎在评论区与我留言分享你的想法也欢迎你把这篇文章分享给你的朋友或同事一起交流。