集搜客爬虫结果很多个xml,于是做了一个python项目,自动将xml文件合并到一个csv文件中!这样excel就可以查看结果了!

liuyuqi-dellpc 86a2a2c900 增加 csv2excel.py 2 years ago
data 295c2854a8 rename folder 5 years ago
.gitignore 7d735d8658 Initial commit 5 years ago
LICENSE 7d735d8658 Initial commit 5 years ago
README.md 86a2a2c900 增加 csv2excel.py 2 years ago
csv2excel.py 86a2a2c900 增加 csv2excel.py 2 years ago
main.py 86a2a2c900 增加 csv2excel.py 2 years ago
requirements.txt 6c162f7d58 更新 'requirements.txt' 4 years ago

README.md

gooExport

集搜客爬虫结果很多个xml,于是做了一个python项目,自动将xml文件合并到一个csv文件中!这样excel就可以查看结果了!

使用方法:

  1. 安装python
  2. pip install -r requirements.txt
  3. main.py中,配置*.xml文件位置

dataPath=xx resultFile=xx

needData=soup.findChild("box1") # 这里 box1 为 jisouke 整理箱的名称,比如box1

爬虫数据放到 data 目录中。

  1. python main.py