pdf文件转换,通过ocr识别,转为一个可搜索文字的pdf。

天问 c1e875816c Add 'Dockerfile' 1 week ago
Dockerfile c1e875816c Add 'Dockerfile' 1 week ago
README.md f4c4d09fd4 Update 'README.md' 1 week ago

README.md

OCRmyPDF

pdf文件转换,通过ocr识别,转为一个可搜索文字的pdf。


docker run -v $(pwd):/app jianboy/ocrmypdf:latest \
    -l eng+fra \
    --rotate-pages \
    --deskew \
    --title "My PDF" \
    --jobs 4 \
    --output-type pdfa \
    input_scanned.pdf output_searchable.pdf