pdf文件转换,通过ocr识别,转为一个可搜索文字的pdf。
docker run -v $(pwd):/app jianboy/ocrmypdf:latest \ -l eng+fra \ --rotate-pages \ --deskew \ --title "My PDF" \ --jobs 4 \ --output-type pdfa \ input_scanned.pdf output_searchable.pdf