Extract subtitles from video using opencv.通过opencv图片识别方法抽取视频中的文字，字幕。

liuyuqi-dellpc 21b2edaa1b 完事，接口限制。多次执行会出错。		6 years ago
assets	9f1b1a6fd6 init	6 years ago
tools-ocr	21b2edaa1b 完事，接口限制。多次执行会出错。	6 years ago
.gitignore	9f1b1a6fd6 init	6 years ago
OcrUtils.py	9f1b1a6fd6 init	6 years ago
README.md	b1dd653c2b xx	6 years ago
main.py	9f1b1a6fd6 init	6 years ago
pre_do.py	9f1b1a6fd6 init	6 years ago
requirements.txt	9f1b1a6fd6 init	6 years ago
user_agent.py	9f1b1a6fd6 init	6 years ago

video-subtitle-extract

无字幕文件的视频，字幕通过opencv图片识别方法抽取其中的文字。

引言

本工具主要为新闻媒体，自媒体等公司服务。实现了一下功能：

对视频中的字幕进行定位，

对视频中字幕通过 自然语言识别 功能提取其中的字幕文字。

把视频文件放到 videos 文件夹中。
先执行 pre_do.py 文件，查看一下视频的帧速，视频尺寸等信息。
通过上一步操作，修改 main.py 中的参数，使得字幕图片被很好的截取。然后执行 main.py 会在 videos 文件夹中生成对视频分析后截取的字幕图片（10句合成一个图片，便于识别）。
执行 MainFm.java 对上述图片进行批量文字识别（分别调用百度/搜狗等文字识别免费接口）。获得结果保存到项目resxxx.txt 文件中。

由于文字识别接口，可能识别错误。所以可以多执行几次，比较结果。