README.md 307 B

OCRmyPDF

pdf文件转换,通过ocr识别,转为一个可搜索文字的pdf。


docker run -v $(pwd):/app jianboy/ocrmypdf:latest \
    -l eng+fra \
    --rotate-pages \
    --deskew \
    --title "My PDF" \
    --jobs 4 \
    --output-type pdfa \
    input_scanned.pdf output_searchable.pdf