spark怎么读取hdfs文件

作者

首页»
云计算»
知识库»
spark怎么读取hdfs文件

发布时间:2024-07-13 14:08

阅读量:1

在Spark中，可以使用sc.textFile()方法来读取HDFS文件。以下是一个简单的示例：

from pyspark import SparkContext  # 创建SparkContext sc = SparkContext("local", "HDFS Read Example")  # 读取HDFS文件 rdd = sc.textFile("hdfs://path/to/your/file.txt")  # 打印文件内容 for line in rdd.collect():     print(line)  # 关闭SparkContext sc.stop()