第 9 章 使用并行流处理大规模数据集:MapCollect模型

第8章介绍了流的概念。流就是一个元素序列,可以使用并行或者顺序的方式进行处理。本章将继续学习如何处理流,主要涉及如下主题。

  • collect()方法。
  • 第一个例子:无索引条件下的数据搜索。
  • 第二个例子:推荐系统。
  • 第三个例子:社交网络中的共同联系人。