1、.机器翻译和计算机辅机器翻译和计算机辅助翻译助翻译 MT& CAT邵白杨 刘洋 刘娜 邓雯 马雪.机器翻译m机器翻译(Machine Translation),又称为自动翻译,是利用计算机把一种自然源语言转变为另一种自然目标语言的过程,它是自然语言处理(Natural Language Processing)的一个分支,与计算语言学(Computational Linguistics)、自然语言理解(Natural Language Understanding)之间存在着密不可分的关系。.一、机器翻译简史m机器翻译的研究历史可以追溯到20世纪四五十年代,学界一般将其划分为如下四个阶段:m1开创
2、期(1946-1964)m 1954年,美国乔治敦大学(Georgetown University)在IBM公司协同下,用IBM-701计算机首次完成了英俄机器翻译试验,向公众和科学界展示了机器翻译的可行性,从而拉开了机器翻译研究的序幕。m中国开始这项研究也并不晚,早在1956年,国家就把这项研究列入了全国科学工作发展规划,课题名称是“机器翻译、自然语言翻译规则的建设和自然语言的数学理论”。1957年,中国科学院语言研究所与计算技术研究所合作开展俄汉机器翻译试验,翻译了9种不同类型的较为复杂的句子。m从20世纪50年代开始到20世纪60年代前半期,机器翻译研究呈不断上升的趋势。.2受挫期(19
3、64-1975)m1964年,为了对机器翻译的研究进展作出评价,美国科学院成立了语言自动处理咨询委员会(Automatic Language Processing Advisory Committee,简称ALPAC委员会),开始了为期两年的综合调查分析和测试。1966年11月,该委员会公布了一个题为语言与机器的报告(简称ALPAC报告),该报告全面否定了机器翻译的可行性,并建议停止对机器翻译项目的资金支持。这一报告的发表给了正在蓬勃发展的机器翻译当头一棒,机器翻译研究陷入了近乎停滞的僵局。无独有偶,在此期间,中国爆发了“十年文革”,基本上这些研究也停滞了。机器翻译步入萧条期。.3恢复期(19
4、75-1989)m进入70年代后,随着科学技术的发展和各国科技情报交流的日趋频繁,国与国之间的语言障碍显得更为严重,传统的人工作业方式已经远远不能满足需求,迫切地需要计算机来从事翻译工作。.4新时期:(1990现在)m随着Internet的普遍应用,世界经济一体化进程的加速以及国际社会交流的日渐频繁,传统的人工作业的方式已经远远不能满足迅猛增长的翻译需求,人们对于机器翻译的需求空前增长,机器翻译迎来了一个新的发展机遇。国际性的关于机器翻译研究的会议频繁召开,中国也取得了前所未有的成就,相继推出了一系列机器翻译软件,例如“译星”、“雅信”、“通译”、“华建”等。. 二 机器翻译的优缺点机器翻译的
5、优缺点弊端:很粗糙,使用者必须先作译前编辑;相应地会增加成本,进而导致成本高于人的翻译。优点:一、准确无误地完成了翻译定额;二、译文也将随着语言学家和程序编制人员探索如何更好地处理语言而得到改进;三、成本也正在稳定下降;四、有助于全世界的学者及时了解现代发展的情况。.机器翻译当前存在机器翻译当前存在的两大突出问题的两大突出问题:一、尚无法做到确认不同讲话人的等值语音二、在处理语义的组成部分上,仍有问题.三三 机器翻译的推动作用机器翻译的推动作用m推动社会的进步推动社会的进步 人类想尽一切办法研制并完成了一个一个的机器翻译系统,开发了一个一个的翻译软件,推动了经济的发展,社会的进步,消除了世界人
6、与人之间的语言障碍,沟通了整个世界,促进了交流,加快了全球化进程。m提高翻译效率提高翻译效率 随着机器翻译研究水平不断提高,翻译领域也取得了前所未有的成就。在我们的翻译工作中,我们可以借助各种翻译系统或软件完成翻译任务,这样可以提高翻译的速度和准确度,提高了翻译工作的效率。m促进其他领域发展促进其他领域发展 机器翻译涉足数学、计算机科学、语言学、翻译学等多门学科领域,需要这些学科强劲的发展,丰厚的成果作基础,从而促进了这些领域的发展。.四四 机器翻译的前景:机器翻译的前景:1、用计算机分析语言将在处理语言材料方面带来重大变革2、计算机将使我们重新获得控制现有各种语言中所可利用的大量情报的能力3
7、、机器翻译的研制成功,必将快速排除交流情报的障碍.计算机辅助翻译m计算机辅助翻译(Computer aided translation,CAT)类似于CAD(计算机辅助设计),能够帮助翻译者优质、高效、轻松地完成翻译工作。 它不同于以往的机器翻译软件,不依赖于计算机的自动翻译,而是在人的参与下完成整个翻译过程。与人工翻译相比,质量相同或更好,翻译效率可提高一倍以上。CAT使得繁重的手工翻译流程自动化,并大幅度提高了翻译效率和翻译质量。计算机辅助翻译是一个广泛的和不精确的术语,涵盖了一系列的工具,从非常简单到更复杂的。.主要功能m在翻译过程中,存在着大量重复或相似的句子和片段。采用人工笔译哪怕是
8、最简单的句子, 也需要书写一遍。 CAT技术具有自动记忆和搜索机制,可以自动存储用户翻译的内容。当用户翻译某个句子时,系统自动搜索用户已经翻译过的句子,如果当前翻译的句子用户曾经翻译过,会自动给出以前的翻译结果;对于相似的句子,也会给出翻译参考和建议。mCAT是一个具有自学习功能的软件,它会随着用户的使用,学习新的单词、语法和句型,为用户节省更多的时间。CAT还配有增强工具CAM (Computer Aided Match),可将用户以前翻译过的资料转换为可以重复使用的记忆库。这样,用户就无需重复以前的劳动,从而提高翻译速度和准确性。.核心技术mCAT技术的核心是翻译记忆技术,当翻译在不停地工
9、作时,CAT则在后台忙于建立语言数据库。这就是所谓的翻译记忆。每当相同或相近的短语出现时,系统会自动提示用户使用记忆库中最接近的译法。用户可以根据自己的需要采用、舍弃或编辑重复出现的文本。.辅助功能m对于CAT技术来说,另一个重要组成部分则是术语管理。广义的说,翻译中出现的任何词汇,如果有重复使用的必要,都可以作为术语进行保存,保存的术语集合则成为术语库。术语库也可以重复利用,不仅仅是在本次翻译,还可以在以后的项目或其他人的翻译工作中重复使用,不但提高工作效率,更重要的是解决翻译一致性问题。.m当前的翻译机构必须倚重翻译技术,越来越多的大中型翻译机构要求加盟的专职和兼职译员掌握诸如Trados
10、、Wordfast等主流的TM软件.计算机辅助翻译基本过程m词汇复用:系统提供大容量的专业词库,为用户节省查词典的时间,可自动进行词频记忆并按词频排序,用户只要点击鼠标或按快捷键即可完成句子翻译。m句子复用:采用先进的翻译记忆( TM)技术,把用户翻译的原文句子和译文自动记忆到数据库中。翻译过程中,通过搜索引擎,自动查找记忆库,对需要翻译的内容进行快速分析、对比,保证相同的句子永远不要翻译第二遍。.m模糊匹配复用:一旦发现与记忆库中例句相同或相似的句子,将根据与原文的匹配情况,系统自动给出翻译建议,用户可选择自动匹配替换,直接得到翻译结果,避免重复性劳动,提高工作效率。m片段复用:如果当前翻译
11、的句子与记忆库中例句有相同的片段时,系统会给出提示,作为翻译时的参考。.翻译项目管理m项目管理是多语翻译和多语软件本地化项目的关键因素。m术语词库准备:在翻译开始之前,项目经理准备术语词库和例句库,由同一项目中的所有翻译者共享。术语词库准备可大大影响项目的成本,还可以统一用词和相同句的译法。m材料接收和完成:翻译者收到项目经理所发来的需翻译的材料和术语词库,就可用翻译软件打开文件,进行翻译。翻译时,翻译者可使用翻译记忆和术语词库,并不断的把新的语言片断加入到翻译记忆中,也不断把新的术语词汇加入到词库中。翻译完成后,翻译者以目的语言代替源语言,建立一个与源语言文件布局完全一致的目的语言文件。再通
12、过电子邮件的形式,发送给项目经理。.m随着全球经济的发展和各国之间交流的增多,对语言翻译的需求将会进一步增加。在这样的背景下,如何更加高效、高质的处理语言转换已经成为众多机构和公司共同关心的问题。计算机辅助翻译技术正是在这种背景下应运而生,它能够帮助翻译者优质、高效、轻松地完成翻译工作。.前景m翻译产业化的重要途径就是翻译信息化,CAT技术的研究,就是为了适应现代计算机技术在语言转换、国际交流、本地化、国际化以及翻译领域中的发展和应用。但这一能够使学生面对市场,面对竞争,面对未来的CAT技术教学,在我国的外语、翻译教学中尚缺乏应有的席位,不能不令人深感遗憾。国内的大学外语或翻译院系,应认识到将CAT这样实用的技术纳入翻译专业课程体系设置的必要性和紧迫性,尽早考虑开设CAT相关课程,使培养的人才能更好地面向社会,面向时代的要求。