集搜客爬虫结果很多个xml,于是做了一个python项目,自动将xml文件合并到一个csv文件中!这样excel就可以查看结果了!

liuyuqi-dellpc abdab4d86d 更新 README.md,添加 Windows 激活虚拟环境的命令;修改 start_gooexport.bat,移除多余的输出设置 1 month ago
data 295c2854a8 rename folder 7 years ago
.gitignore 4668d91ff9 0 1 month ago
LICENSE 7d735d8658 Initial commit 7 years ago
README.md abdab4d86d 更新 README.md,添加 Windows 激活虚拟环境的命令;修改 start_gooexport.bat,移除多余的输出设置 1 month ago
csv2excel.py 86a2a2c900 增加 csv2excel.py 4 years ago
main.py b6155f8022 更新 main.py,增加时间戳生成结果文件名的功能 1 month ago
requirements.txt 4668d91ff9 0 1 month ago
start_gooexport.bat abdab4d86d 更新 README.md,添加 Windows 激活虚拟环境的命令;修改 start_gooexport.bat,移除多余的输出设置 1 month ago

README.md

gooExport

集搜客爬虫结果很多个xml,于是做了一个python项目,自动将xml文件合并到一个csv文件中!这样excel就可以查看结果了!

使用方法:

  1. 安装python
  2. pip install -r requirements.txt
  3. main.py中,配置*.xml文件位置

dataPath=xx resultFile=xx

needData=soup.findChild("box1") # 这里 box1 为 jisouke 整理箱的名称,比如box1

爬虫数据放到 data 目录中。

  1. python main.py

    virtualenv .venv
    source .venv/bin/activate
    .venv\Scripts\activate.bat
    
    pip install pyinstaller
    
    pip install -r requirements.txt
    
    python main.py -i /workspace/gooExport/data
    
    pyinstaller --onefile main.py
    

License

References