商务沟通中,PDF格式文档使用日益增多。大多数CAT软件或平台均可处理简单格式PDF文档;但对于很多设计复杂、图文并茂的PDF文档而言,CAT软件预处理后会出现大量断行和tags,一一处理着实麻烦,且导出时又会有很多错乱,增加项目难度。根据本人经验,可尝试一下解决办法。

常见PDF制作工具

首先应该理解PDF背后的原理,其制作基本上可以分为三大类:

1.其他文档格式转换。如Office另存为PDF,如PDF虚拟打印机可设置打印的文档格式为PDF;

2.直接新建的PDF文档。如Acrobat、ABBYY、PDF Readers、Foxit、InDesign等;

3.纸质文档扫描成PDF文件。

较难处理的是InDesign文档和扫描文档。

PDF文档翻译前预处理

重要提示:如有可能,尽量跟客户要可编辑文档或者源文件,多问一句可能会节省你很多时间。

如果客户实在无法提供,尝试下述步骤:

  1. 如果是简单格式PDF文档,在导入CAT工具前,可用Acrobat、ABBYY等先将其转为Word文档,或者RTF格式文档,否则容易有断行和过多标签。导出后,再对照原文检查格式,进行手动调整;

  2. 如果是InDesign创建文档,强行转换成Word文档后,最先看到会有字体丢失等现象。导入到CAT工具后,会发现问题更多,预处理(Pre-translate)或者假翻译(Pseudo-translate)后导出会发现,格式上会有很多细微偏差,着实让人头疼;经过多次对比,发现Trados在最终格式上比其它翻译软件都好一些,剩下的只能手工调整,目前没有更好的解决方法。

  3. 如果是扫描版PDF文件,ABBYY等OCR识别软件可以识别大部分,剩下也只能手工调整,目前无解;

  4. 询问过Max、Wooten,他们也没有更好的解决办法,建议还是要回来InDesign的源文件;Lihang告诉我“直接导出为txt纯文本文件翻译,再排版时手动替换,或者用CAT打开idml,导入之前翻译txt生成的翻译记忆。”无论如何,都需要大量的人工干预。

InDesign源文件PDF文档翻译

  1. 将InDesign文件另存为INX/IDML/ICML等任一格式,脚本一键实现;

  2. 导入到Trados进行翻译,如同翻译Word文档一样;

  3. 翻译完毕后,将文件转回为InDesign文件即可。