集搜客爬虫结果很多个xml,于是做了一个python项目,自动将xml文件合并到一个csv文件中!这样excel就可以查看结果了!
|
|
11 months ago | |
|---|---|---|
| data | 8 years ago | |
| .gitignore | 11 months ago | |
| LICENSE | 8 years ago | |
| README.md | 11 months ago | |
| csv2excel.py | 5 years ago | |
| main.py | 11 months ago | |
| requirements.txt | 11 months ago | |
| start_gooexport.bat | 11 months ago |
集搜客爬虫结果很多个xml,于是做了一个python项目,自动将xml文件合并到一个csv文件中!这样excel就可以查看结果了!
使用方法:
dataPath=xx resultFile=xx
needData=soup.findChild("box1") # 这里 box1 为 jisouke 整理箱的名称,比如box1
爬虫数据放到 data 目录中。
python main.py
virtualenv .venv
source .venv/bin/activate
.venv\Scripts\activate.bat
pip install pyinstaller
pip install -r requirements.txt
python main.py -i /workspace/gooExport/data
pyinstaller --onefile main.py