自动后编辑技术在机器翻译中的应用

日期:2015-09-24 16:00:00    阅读:1139

翻译公司北京天译时代翻译公司小编为大家整理SPE技术的应用。SPE(自动后编辑)技术本质是对机器翻译结果的一种统计矫正过程,对于改进基于规则的机器翻译系统的效果尤为明显。规则系统的整个翻译过程由规则主导,翻译结果呈现出一定的规律性,翻译中的错误同样也具有规律性。通过将规则系统和统计系统串联,把规则系统的输出,作为基于统计系统的输入,来自动矫正规则系统输出结果中错误,可以大幅度改进机器翻译结果的准确率。这种方法的优势是:最终译文中保留了基于规则系统的优点,如:长距离依赖关系及其他语法限制等,而短语搭配的流利度却可以得到大幅改善。实践表明,这种方法,不仅仅可以大幅提高基于规则的机械翻译系的性能,而且相对于单引擎模式下基于短语的统计机器翻译系统,也有一定的优势。
目前,SPE的方法主要分成两类:第一种方法,以Simard等人为代表,统计模型的训练过程中,使用规则系统输出作为源语言,使用人工编辑矫正过结果做为目标语言,进行训练语料。第二种方法,则直接使用双语平行语料作为训练语料。第一种方法的重点在于,矫正基于规则的系统的输出结果中的错误,这些错误矫正原则是人工编辑的译文为基础,训练得来。第二种方法,重点是矫正输出假设译文和参考译文间的差异,使基于规则的系统的输出结果更接近于参考译文,矫正的可能并不是某种错误,而仅仅是结果更接近训练语料中的表达方式。
SPE技术已经逐渐被各大主流机器翻译公司所使用,成为新一代机器翻译引擎中的一项核心技术,例如机器翻译巨头SYSTRAN和国内老牌机器翻译公司北京天译时代翻译等,都已经成功将这项技术引入到自己的产品中,对传统的基于规则的机器翻译系统的性能,起到了大幅度的改进作用。

推荐阅读内容