校花,妹子爬虫
1、先爬取数据。
2、在用python处理数据,下载图片。
3、sas工具定性分析。

liuyuqi-dellpc c8d667c1a1 set static folder 7 months ago
bin 5ab1b39aac 更改项目结构 7 months ago
conf 9597fda8c8 modify xiaohuar extractor 7 months ago
crawl_xiaohua c8d667c1a1 set static folder 7 months ago
data 094ecaf7e9 init 6 years ago
docs c8d667c1a1 set static folder 7 months ago
meizi e1fb44bb84 添加 妹子图 爬虫 4 years ago
test 5ab1b39aac 更改项目结构 7 months ago
.gitignore 5ab1b39aac 更改项目结构 7 months ago
LICENSE 6204c93e8a Initial commit 6 years ago
README.md b5c3ac99a5 modify readme 7 months ago
main.py 9597fda8c8 modify xiaohuar extractor 7 months ago
requirements.txt 17ac653d70 优化项目结构 7 months ago
setup.py 3feb48740d add setup 7 months ago
www.xiaohua.com.http 5ab1b39aac 更改项目结构 7 months ago

README.md

xiaohua_crawl

目前本项目包含两个小项目:校花网爬虫,妹子网爬虫。后续爬取结果陆续发布,并定时追加更新。

1、 先爬取数据。数据存放到 data 文件夹。 2、 在用 python 处理数据,下载图片。 3、 sas 工具定性分析。

Development

Read this Development document.

结果

1、 校花图片

爬了很多校花的靓照,以大学-名字命名,比如:上海师范大学天华学院-周雯琳。

2、 校花通讯录

爬了很多校花的详细资料,比如姓名,年龄,三围,学校,兴趣等等,最后统一做成通讯录形式。