第 9 章 使用并行流处理大规模数据集:MapCollect模型第 9 章 使用并行流处理大规模数据集:MapCollect模型第8章介绍了流的概念。流就是一个元素序列,可以使用并行或者顺序的方式进行处理。本章将继续学习如何处理流,主要涉及如下主题。 collect()方法。 第一个例子:无索引条件下的数据搜索。 第二个例子:推荐系统。 第三个例子:社交网络中的共同联系人。