# Hadoop 相关依赖 # PySpark - 用于现代大数据处理 pyspark>=3.0.0 # 可选:HDFS 客户端库(如果不想使用命令行工具) # hdfs>=2.7.0 # pyhdfs>=0.3.0 # 工具库 click>=7.0 # 用于创建命令行工具 rich>=10.0.0 # 用于美化输出