(1)spark核心RDD的概念解析、创建、以及相关操作

spark核心之RDD 什么是RDD RDD指的是弹性分布式数据集(Resilient Distributed Dataset),它是spark计算的核心。尽管后面我们会使用DataFrame、Dat … Continue reading (1)spark核心RDD的概念解析、创建、以及相关操作