|
@@ -1,47 +1,7 @@
|
|
|
-# 教学立方课件下载器
|
|
|
+# 教学立方课件爬虫
|
|
|
|
|
|
在线教学平台——[教学立方](teaching.applysquare.com)的课件批量下载脚本,基于**Python** + **ChromeDriver**
|
|
|
|
|
|
-> 创建日期:2020-03-30
|
|
|
-> 更新日期:2020-04-16
|
|
|
-
|
|
|
-## 版本更新信息(重要!)
|
|
|
-
|
|
|
-1. 已于4月16日上午发布最新版本的release包,**请于4月14日前获取代码的同学重新**[**下载脚本**](https://github.com/EricZhu-42/PedagogySquare_Downloader/releases/download/v1.2_stable/PedagogySquare_Downloader_20200416.zip)。
|
|
|
-2. 当前**已适配最新的教学立方4.2版本**(推出于**2020年4月10日**),且增加了对课件文件夹的支持
|
|
|
-
|
|
|
-## 程序特色
|
|
|
-
|
|
|
-1. **一键下载**所有课程的全部课件,方便快捷
|
|
|
-2. **可下载未直接开放下载的课件**,视频等内容
|
|
|
-3. **可深度配置**的课程筛选/文件拓展名筛选功能
|
|
|
-
|
|
|
-以下为运行过程中控制台截图示例:
|
|
|
-
|
|
|
-
|
|
|
-
|
|
|
-> 本程序旨在方便学生下载教学立方平台上的课件及相关教学资料,消除下载文件的重复劳动
|
|
|
-> 请尊重教师的知识产权与劳动成果。除非获得教师许可,请勿将下载得到的文件在互联网上进行传播
|
|
|
-> 如本程序损害了您的权益,请联系作者删除相关代码
|
|
|
-
|
|
|
-## 开发环境
|
|
|
-
|
|
|
-开发过程中使用的环境与第三方模块版本如下:
|
|
|
-
|
|
|
-- **Python** = 3.7.4
|
|
|
-
|
|
|
-- **Requests** = 2.22.0
|
|
|
-
|
|
|
-- **Selenium** = 3.141.0
|
|
|
-
|
|
|
-使用的浏览器与WebDriver为:
|
|
|
-
|
|
|
-- **Chrome** = 75.0.3770.142,包含对应版本的ChromeDriver
|
|
|
-
|
|
|
-> **理论上**该脚本**兼容**其他版本的Python环境(新的一般没问题,旧一点的应该也行),但请在发生错误时关注兼容性问题
|
|
|
->
|
|
|
-> 该脚本针对Chrome + ChromeDriver开发,如使用其他Browser + WebDriver组合需要修改脚本中的WebDriver参数
|
|
|
-(更新:**Chromium Edge** + ChromeDriver **可以**正常使用该脚本)
|
|
|
|
|
|
## 使用方法
|
|
|
|
|
@@ -62,20 +22,8 @@
|
|
|
> 关于如何修改配置文件,请参考”最简配置方案“一章
|
|
|
> 关于配置文件内各项参数的说明,请参考”配置文件说明“一章
|
|
|
|
|
|
-### 3. 运行脚本
|
|
|
-
|
|
|
-运行 `download.py`
|
|
|
|
|
|
-> 注:若运行过程中出现下载速度过慢等现象,可能是由于与教学立方网站连接不稳定,请尝试重新运行脚本。
|
|
|
|
|
|
-## 项目结构介绍
|
|
|
-
|
|
|
-| 文件名 | 功能 |
|
|
|
-| ------------------- | ------------------------ |
|
|
|
-| figure/ | 脚本说明中用到的图片文件 |
|
|
|
-| download.py | 脚本运行入口 |
|
|
|
-| config.json | 执行参数的配置文件 |
|
|
|
-| config_example.json | 供参考的样例配置文件 |
|
|
|
|
|
|
## 最简配置方案
|
|
|
|
|
@@ -110,22 +58,3 @@
|
|
|
| ext_list | list | 下载文件的类型(如:pdf,docx,zip) |
|
|
|
| ext_expel_list | list | 排除文件的类型 |
|
|
|
| cid_list | list | 需要下载的课程ID |
|
|
|
-
|
|
|
-#### 注意:
|
|
|
-
|
|
|
-1. 文件类型参数优先级为:`ext_expel_list` > `download_all_ext` > `ext_list`
|
|
|
- 如:若希望下载“除了zip格式文件外的所有类型文件“,应设置参数为
|
|
|
-
|
|
|
- - `download_all_ext` = `true`
|
|
|
- - `ext_list` = `["zip"]`
|
|
|
-
|
|
|
-2. 课程ID在课程主页地址中查看,例如:
|
|
|
- 
|
|
|
- 图中对应课程的ID为**8261**
|
|
|
-
|
|
|
-
|
|
|
-## 版权信息
|
|
|
-
|
|
|
-联系邮箱:zhuxinhao00@gmail.com
|
|
|
-
|
|
|
-本项目基于MIT协议开源
|