“解码”机器翻译

日期:2009-10-15 10:20:35    阅读:3368

机器翻译(简称“机译”)是一个充满挑战的研究领域,被列为21世纪世界十大科技难题的第一位。发明家、未来学家雷·科兹威尔日前在接受美国媒体《赫芬顿邮报》的采访时预言,到2029年机器翻译的质量将接近人工翻译的水准。

机器翻译是利用计算机把一种语言(源语言) 翻译成另一种语言(目标语言)的过程;而用以完成这一过程的软件叫做机译系统。自从被誉为机译鼻祖的美国数学家、工程师沃伦·韦弗1947年提出机译设想以来,机译研究经历了艰难而曲折的发展历程。

1954年,美国乔治敦大学在 IBM 公司的协助下,用IBM-701型计算机首次完成了英俄机译试验,向公众和科学界展示了机译的可行性,从而拉开了机译研究的序幕。当时由于人们忽略了自然语言和翻译本身的复杂性以及机器自身的局限性,机译系统的翻译质量很差。

近年来,由于互联网的普遍应用、全球化进程的加速以及国际交流的日趋频繁,机译迎来了一个新的发展机遇。机译的效率和质量都有了明显的提高;在线翻译成了当今的重头戏。

时下功能较强的在线翻译工具有谷歌翻译、雅虎翻译、必应翻译等。这种翻译主要是采用统计学匹配原理,往计算机内输入大量的文字文本,包括源语言的文本,以及对应目标语言人工翻译的文本,通过海量统计数据来提高翻译的精确度。谷歌翻译目前可提供58种语言之间的即时翻译;它可以提供所支持的任意两种语言之间的互译。前不久,谷歌推出了一款手机翻译软件,能让手机即时翻译用户通话,不过仅限于英语和西班牙语;但在不久的将来,谷歌将会推出包含其它语言的升级版本,未来还可能进行“同声传译”。

近年来,美国南加州大学的科学家们利用军事中的密码学,把翻译视为一种“解码”过程;这种翻译方法目前只能翻译一些短句或电影字幕,尚未运用到长句或片段翻译中,但它却给机译打开了一条新的思路。他们表示,用这种技术研发的机译系统不但能翻译各种语言,还可能破译“海豚音”和“外星人语言”。

但在人类尚未明了“人脑是如何进行语言的模糊识别和逻辑判断”的情况下,机译要想达到“信、雅、达”的程度是不可能的,这恐怕是机译发展遇到的最大的瓶颈。

推荐阅读内容