RDD的几种创建方式与US六仔源码搭建

来源:这里教程网 时间:2026-03-01 11:13:24 作者:

在RDD中,US六仔源码搭建【企 娥:217 1793 408】通常就代表和包含了Spark应用程序的输入源数据。  当我们,在创建了初始的RDD之后,才可以通过Spark Core提供的transformation算子,对该RDD进行transformation(转换)操作,来获取其他的RDD。  Spark Core为我们提供了三种创建RDD的方式,包括:  1. 使用程序中的集合创建RDD  2. 使用本地文件创建RDD  3. 使用HDFS文件创建RDD 应用场景  1. 使用程序中的集合创建RDD,主要用于进行测试,可以在实际部署到集群运行之前,自己使用集合构造测试数据,来测试后面的spark应用的流程  2. 使用本地文件创建RDD,主要用于的场景为:在本地临时性地处理一些存储了大量数据的文件  3. 使用HDFS文件创建RDD,应该是最常用的生产环境处理方式,主要可以针对HDFS上存储的大数据,进行离线批处理操作

相关推荐