10.5　下游收集器：filtering与flatMapping

10.5　下游收集器：filtering与flatMapping

10.5　下游收集器：`filtering`与`flatMapping`

问题

用户希望将元素作为下游收集器（downstream collector）的一部分进行筛选，或将集合的集合展平。

方案

使用 Java 9 为 Collectors 类新增的 filtering 和 flatMapping 方法。

讨论

Java 8 为 Collectors 类引入了 groupingBy 操作，用于根据特定的属性将对象分组。分组操作将产生一个“键 - 值列表”映射（Map>）。Java 8 还支持使用下游收集器，可以不必生成列表，而是对列表进行后期处理以获取其大小，或将列表映射为其他内容。

Java 9 新增了两种下游收集器，它们是 filtering 和 flatMapping。

filtering方法

假设存在两个类，一个类是 Task，该类包括描述预算的属性以及承担任务的开发人员列表；另一个类是 Developer，它的实例用于描述开发人员。两个类如例 10-21 所示。

例 10-21　Task 和 Developer 类

public class Task {
    private String name;
    private long budget;
    private List<Developer> developers = new ArrayList<>();
　
    // 构造函数、getter、setter等
}
　
public class Developer {
    private String name;
　
    // 构造函数、getter、setter等
}

首先，我们根据预算对任务进行分组。例 10-22 显示了一个简单的 groupingBy 操作。

例 10-22　根据预算对任务分组

Developer venkat = new Developer("Venkat");
Developer daniel = new Developer("Daniel");
Developer brian = new Developer("Brian");
Developer matt = new Developer("Matt");
Developer nate = new Developer("Nate");
Developer craig = new Developer("Craig");
Developer ken = new Developer("Ken");
　
Task java = new Task("Java stuff", 100);
Task altJvm = new Task("Groovy/Kotlin/Scala/Clojure", 50);
Task javaScript = new Task("JavaScript (sorry)", 100);
Task spring = new Task("Spring", 50);
Task jpa = new Task("JPA/Hibernate", 20);
　
java.addDevelopers(venkat, daniel, brian, ken);
javaScript.addDevelopers(venkat, nate);
spring.addDevelopers(craig, matt, nate, ken);
altJvm.addDevelopers(venkat, daniel, ken);
　
List<Task> tasks = Arrays.asList(java, altJvm, javaScript, spring, jpa);
　
Map<Long, List<Task>> taskMap = tasks.stream()
        .collect(groupingBy(Task::getBudget));

由此建立了预算金额与分配该预算的任务列表之间的映射：

 50: [Groovy/Kotlin/Scala/Clojure, Spring]
 20: [JPA/Hibernate]
100: [Java stuff, JavaScript (sorry)]

如果只希望获取预算超过某个阈值的任务，可以添加一个 filter 操作，如例 10-23 所示。

例 10-23　利用 filter 操作进行分组

taskMap = tasks.stream()
        .filter(task -> task.getBudget() >= THRESHOLD)
        .collect(groupingBy(Task::getBudget));

如果阈值为 50，程序的输出如下：

 50: [Groovy/Kotlin/Scala/Clojure, Spring]
100: [Java stuff, JavaScript (sorry)]

可以看到，预算低于阈值的任务不会出现在输出映射中，不过仍然有办法显示这些任务：在 Java 9 中，Collectors 类新增了一个名为 filtering 的静态方法，它与 filter 类似，只不过用于下游任务列表的筛选。filtering 方法的用法如例 10-24 所示。

例 10-24　利用下游筛选器进行分组

taskMap = tasks.stream()
    .collect(groupingBy(Task::getBudget,
          filtering(task -> task.getBudget() >= 50, toList())));

此时，所有预算金额都会以键的形式显示出来，但预算低于阈值的任务不会出现在列表值中：

 50: [Groovy/Kotlin/Scala/Clojure, Spring]
 20: []
100: [Java stuff, JavaScript (sorry)]

因此，filtering 操作是一种下游收集器，可以对分组操作产生的列表操作。

flatMapping方法

那么，如何获取承担每项任务的开发人员列表呢？如例 10-25 所示，借由基本的分组操作，可以根据任务名对任务分组。

例 10-25　根据任务名分组

Map<String, List<Task>> tasksByName = tasks.stream()
        .collect(groupingBy(Task::getName));

（格式化后的）输出如下：

                 Java stuff: [Java stuff]
Groovy/Kotlin/Scala/Clojure: [Groovy/Kotlin/Scala/Clojure]
         JavaScript (sorry): [JavaScript (sorry)]
                     Spring: [Spring]
              JPA/Hibernate: [JPA/Hibernate]

为获取与任务关联的开发人员列表，我们使用下游收集器 mapping，如例 10-26 所示。

例 10-26　承担每项任务的开发人员列表

Map<String, Set<List<Developer>>> map = tasks.stream()
        .collect(groupingBy(Task::getName,
              Collectors.mapping(Task::getDevelopers, toSet())));

不过，返回类型是 Set>，而我们需要的是一个下游 flatMap 操作来展平集合的集合。为此，可以使用 Collectors 类新增的 flatMapping 方法，如例 10-27 所示。

例 10-27　利用 flatMapping 方法获取一组开发人员

Map<String, Set<Developer>> task2setdevs = tasks.stream()
        .collect(groupingBy(Task::getName,
                Collectors.flatMapping(task -> task.getDevelopers().stream(),
                toSet())));

（格式化后的）输出如下：

                 Java stuff: [Daniel, Brian, Ken, Venkat]
Groovy/Kotlin/Scala/Clojure: [Daniel, Ken, Venkat]
         JavaScript (sorry): [Nate, Venkat]
                     Spring: [Craig, Ken, Matt, Nate]
              JPA/Hibernate: []

Collectors.flatMapping 方法类似于 Stream.flatMap 方法。需要注意的是，flatMapping 方法的第一个参数应是一个流，它可以为空，或不依赖于数据源。

另见

有关下游收集器的讨论请参见范例 4.6，有关 flatMap 操作的讨论请参见范例 3.11。

10.5 下游收集器：filtering与flatMapping

10.5 下游收集器：filtering与flatMapping

问题

方案

讨论

另见

10.5　下游收集器：`filtering`与`flatMapping`