Spark sortByKey函数怎么使用

avatar
作者
筋斗云
阅读量:0

sortByKey函数是Spark中的一个操作,它可以对键值对RDD中的键进行排序。

使用sortByKey函数的语法如下:

val sortedRDD = pairRDD.sortByKey([ascending: Boolean], [numPartitions: Int]) 

参数说明:

  • ascending:可选参数,表示是否按升序排序,默认为true。
  • numPartitions:可选参数,表示输出的RDD的分区数,默认为输入的RDD的分区数。

示例:

val rdd = sc.parallelize(List((3, "apple"), (2, "banana"), (1, "orange"))) val sortedRDD = rdd.sortByKey() sortedRDD.foreach(println) 

输出结果:

(1,orange) (2,banana) (3,apple) 

在上面的示例中,我们创建了一个键值对RDD,然后使用sortByKey函数对键进行排序,默认按升序排序。最后通过foreach操作来打印排序后的结果。

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!