Browse Source

添加readme

liuyuqi-dellpc 6 years ago
parent
commit
3e00fc1599
3 changed files with 11 additions and 0 deletions
  1. 1 0
      .gitignore
  2. 10 0
      README.md
  3. BIN
      shlib/spiders/__init__.pyc

+ 1 - 0
.gitignore

@@ -0,0 +1 @@
+/shlib/spiders/*.pyc

+ 10 - 0
README.md

@@ -0,0 +1,10 @@
+#第一步:
+从下面链接检索所有书籍,分页,分页大于10就存10页。
+http://ipac.library.sh.cn/ipac20/ipac.jsp?session=149732O9Q6656.580&menu=search&aspect=basic_search&npp=10&ipp=20&profile=sl&ri=&index=.TW&term=大数据&x=0&y=0&aspect=basic_search
+#第二步:
+第一步每页解析每本书url,存储书目,索书号,馆借记录:
+http://ipac.library.sh.cn/ipac20/ipac.jsp?session=1M973O24348D8.1202&profile=sl&uri=full=3100001@!4746825@!0&ri=1&aspect=basic_search&menu=search&source=172.16.103.188@!shcl&ipp=20&staffonly=&term=hadoop&index=.TW&uindex=&aspect=basic_search&menu=search&ri=1
+#第三步:
+所得结果,存储数据库。书目列表id,馆借记录(关联书目id)。
+#第四步:
+web搜索,email推送信息。

BIN
shlib/spiders/__init__.pyc