# crawl_yuque [![](https://img.shields.io/badge/version-1.0.1-brightgreen.svg)](https://git.yoqi.me/lyq/crawl_yuque) [![](https://img.shields.io/badge/Python-3.11.5-brightgreen.svg)](https://git.yoqi.me/lyq/crawl_yuque) 语雀文档 一键导出 markdown ## Develop 复制文档url,执行如下命令: ``` python main.py markdown -url https://www.yuque.com/burpheart/phpaudit wget https://fileshare.yoqi.me/d/dl/c/Python/crawl_yuque/crawl_yuque chmod +x crawl_yuque ./crawl_yuque markdown -url https://www.yuque.com/burpheart/phpaudit ``` 私有文档配置 .env 文件,chrome 获取cookie填入即可,登录状态可以看到的项目都可以获取。 ## 源码分析 运行 main.py,获取url参数调用requests获取源码,查找如下网页源码: ``` ``` 可以发现,云雀将内容存储在window.appData中,我们只需要将其转换为json格式,即可获取到所有的文章内容。 ## License Licensed under the [Apache 2.0](LICENSE) © [liuyuqi.gov@msn.cn](https://github.com/jianboy) ## Reference 目前有一些其他语言,如php,node 实现的采集工具,本项目实现的主要用途针对自己的项目,导出markdown文件,方便多平台同步。 - [gxr404/yuque-dl](https://github.com/gxr404/yuque-dl)