集搜客爬虫结果很多个xml,于是做了一个python项目,自动将xml文件合并到一个csv文件中!这样excel就可以查看结果了!
liuyuqi-dellpc abdab4d86d 更新 README.md,添加 Windows 激活虚拟环境的命令;修改 start_gooexport.bat,移除多余的输出设置 | 1 month ago | |
---|---|---|
data | 7 years ago | |
.gitignore | 1 month ago | |
LICENSE | 7 years ago | |
README.md | 1 month ago | |
csv2excel.py | 4 years ago | |
main.py | 1 month ago | |
requirements.txt | 1 month ago | |
start_gooexport.bat | 1 month ago |
集搜客爬虫结果很多个xml,于是做了一个python项目,自动将xml文件合并到一个csv文件中!这样excel就可以查看结果了!
使用方法:
dataPath=xx resultFile=xx
needData=soup.findChild("box1") # 这里 box1 为 jisouke 整理箱的名称,比如box1
爬虫数据放到 data 目录中。
python main.py
virtualenv .venv
source .venv/bin/activate
.venv\Scripts\activate.bat
pip install pyinstaller
pip install -r requirements.txt
python main.py -i /workspace/gooExport/data
pyinstaller --onefile main.py