| 123456789101112131415161718192021222324252627 |
- """
- Hadoop Tools - Python 版本
- 提供 Hadoop 数据分析能力,包括:
- - HDFS 文件系统操作
- - MapReduce 作业执行
- - 大数据处理工具
- 模块结构:
- - hdfs_operations: HDFS 文件系统操作
- - mapreduce: MapReduce 作业实现
- - wordcount_streaming: Hadoop Streaming 方式的词频统计
- - wordcount_spark: PySpark 方式的词频统计
- - utils: 工具函数
- """
- from .hdfs_operations import HDFSOperations
- from .mapreduce.wordcount_streaming import WordCountStreaming
- from .mapreduce.wordcount_spark import WordCountSpark
- __all__ = [
- 'HDFSOperations',
- 'WordCountStreaming',
- 'WordCountSpark'
- ]
- __version__ = '0.1.0'
|