PDF 批量转换工具,支持转换为 HTML 或 Word 文档(.docx)
docker build --pull --rm -f "Dockerfile" -t pdf2html:latest .
alias pdf2html='docker run --rm -it -v `pwd`:/app pdf2html:latest'
docker run --rm -it -v `pwd`:/app pdf2html:latest --mode html
# 或使用别名
pdf2html --mode html
输出文件保存在 htmls/ 目录
docker run --rm -it -v `pwd`:/app pdf2html:latest --mode docx
# 或使用别名
pdf2html --mode docx
输出文件保存在 docs/ 目录
--mode: 转换模式
html (默认): 转换为 HTML 格式docx: 转换为 Word 文档格式htmls/docs/