在Python中,您可以使用Hadoop的Python库pyhdfs
来上传和读取文件。首先,您需要确保已经安装了pyhdfs
库。您可以使用pip安装:
pip install pyhdfs
接下来,您可以使用以下示例代码来进行文件上传和读取操作:
from pyhdfs import HdfsClient# 连接到HDFS
client = HdfsClient(hosts='your-hadoop-host:50070', user_name='your-username')# 上传文件到HDFS
client.copy_from_local('local_file.txt', '/hdfs/path/file.txt')# 从HDFS读取文件
client.copy_to_local('/hdfs/path/file.txt', 'local_file.txt')
请确保替换上述代码中的your-hadoop-host:50070
,your-username
,local_file.txt
和/hdfs/path/file.txt
为您实际的Hadoop集群主机、用户名、本地文件路径和HDFS文件路径。
希望这可以帮助您在Python中使用Hadoop进行文件上传和读取操作。