pySpark RDD基本用法

pySpark RDD基本用法 RDD的全称是:Resilient Distributed Dataset (弹性分布式数据集),它有几个关键的特性: RDD是只读的,a56爆大奖在线娱乐它的不可变性。 可以并行的操作分区集合上的所有元素。 a56爆大奖在线娱乐RDD的内部,有5个主要特性: A list of partition
posted @ 2022-08-26 14:43  身带吴钩  阅读(610)  评论(0编辑  收藏  举报