到位的一个同学的问题。
在台湾某学术网站,下载中/英等学术性pdf,里面都是专业的中英文翻译。所以目的就是通过相关数据处理,提取所有pdf内容,对中英文文档进行对比。甚至可以通过机器学习,让机器更好的翻译,而不是人工对每篇文章都提供中英文文档。
解决问题:
使用: 1、clone代码 2、设置main.java中的项目目录,输出文件。 3、运行main代码即可。