ImageVerifierCode 换一换
格式:PPT , 页数:26 ,大小:154.50KB ,
文档编号:3391306      下载积分:22 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-3391306.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(三亚风情)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(融入句型信息的汉英双向调序模型课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

融入句型信息的汉英双向调序模型课件.ppt

1、1融入句型信息的汉英双向调序模融入句型信息的汉英双向调序模型型 张家俊、宗成庆 中科院自动化所 2008.11.282背景o 自从IBM翻译模型的提取,特别是基于短语的翻译模型提出后,调序模型始终是统计机器翻译的关键问题,是研究的热点o 从基于距离的扭曲模型、词汇化的调序模型到层次化的短语翻译模型、最大熵调序模型,都非常有效地提高了翻译质量3想法o 这些模型没有充分利用语言所固有的语法信息,在不需要调序的地方浪费了大量的计算时间o 这些模型没有充分利用句子的先验知识,譬如句型,因为不同的句型具有不同的调序策略4句型在调序中的作用o 几个例子:5句型调序分析o 特殊疑问句中至少有一固定的短语(我

2、们称为特殊疑问短语)在翻译成英语时通常出现在句首;o 一般疑问句在翻译时有特定的例如can,do,is等引导词;o 在非疑问句中,有很大比例的句子中出现介词短语、时间地点短语,这些短语在汉语中出现在动词前,而在翻译时一般出现在动词的后面6口语语料分析o 我们分析277k 中英对齐句对发现,大约 17.2%是特殊疑问句,约 25.5%为一般疑问句,其余为非疑问句。o 可见在口语翻译中,基于句型的调序是非常有意义且具有研究价值的7基于句型调序的翻译框架(汉英)英 语 输出C1C3C2汉 语 输入句子后向、前向调序模型 后向调序模型翻译引擎分类器后向调序模型8基于句型调序的翻译框架(英汉)o C1、

3、C2和C3的意义同上图,“逆”表示与上图的算法相似但调序方向相反 C1C3C2英 语 输入句子逆后向、前向调序模型 逆后向调序模型汉语结果输出分类器逆后向调序模型英 汉 翻译引擎9模型与算法o 句型的分类算法:SVM-basedo 前向调序模型、逆前向调序模型o 后向调序算法、逆后向调序模型10句型分类算法o SVM的优势,分类准确,几乎不受标点的影响(我们知道标点是句型关键性的特征)o 实验:n 语料:三类句型分别问1000句,80%作为训练,20%作为测试n 实验结果:11前向调序模型o 适用句型:特殊疑问句o 调序对象:特殊疑问短语o 调序的两个关键问题:u 特殊疑问短语的识别u 正确的

4、调序位置12调序的两个关键问题o 特殊疑问短语的识别u 我们在语法上给特殊疑问短语一个定义:包含特殊疑问词的完整的语法成分。u 特殊疑问词是利用互信息得到的一个闭集:什么、哪、多(多长、多久)、怎、谁、几、为什么、何u 在汉语中,从语法层面看来,特殊疑问短语可能会是任何一类语法成分,从语法层无法识别u 我们采用chunking的浅层句法分析来识别特殊疑问短语13调序的两个关键问题o 正确的调序位置u 分析翻译实例我们发现,调序的位置分为3类:句首、子句首、特定模板短语(从对齐语料习得)后u 分别举例:这个 味道 怎么样?=怎么样 这个 味道?请问,去 海滩 怎么 走?=请问,怎么 走去 海滩?

5、你 认为 到 那 要 多长 时间?=你 认为 要 多长 时间 到 那?14逆前向调序模型o 适用句型和处理对象与前向模型一样o 面向英汉翻译任务n 对翻译结果的修正o 同样面临调序的两个关键问题:u 特殊疑问短语的识别u 正确的调序位置15调序的两个关键问题o 特殊疑问短语的识别同前向模型o 调序的目标位置:n 特殊疑问句的结构n 调序规则16调序的两个关键问题o 特殊疑问句的两种结构n 作为强调部分出现在句末 n 作为动词短语的修饰成分出现在动词短语的前面 o 调序规则n 若SQP为动词短语,则将其调至包含该SQP的子句末尾 n 若SQP不是动词短语,而且中有动词短语,则保持其位置不变;否则

6、将其调至包含该SQP的子句末尾 17后向调序模型o 针对句型:所有句型o 调序对象:在翻译中最有可能调序的短语=介词短语、时间地点短语o 调序的两个关键问题u 介词短语、时间地点短语与动词短语的识别u 调序策略18调序的两个关键问题o 介词短语、时间地点短语与动词短语的识别u 采用chunking浅层句法分析u 虚拟动词短语(VVP)的定义:由于识别错误等原因,有时在介词短语、时间地点短语后没有识别出动词短语。为加强该模型的适应性,我们定义自此介词或时间地点短语后到子句的结束为伪动词短语,并赋予其动词短语的功能。u 例:请 在 这里 签名。“签名”被识别为NP,在我们的模型中,它就是VVP19

7、调序的两个关键问题o 调序策略:利用最大熵模型决定识别出的介词或时间地点短语是否需调序到紧跟着它们的动词短语后。o 调序规则:12122 1AXAstraightAXAXAAinverted1,APP TP SP2,AVP VVP12Xphrases between A and A20逆后向调序模型o 面向英汉翻译任务o 介词短语、时间地点短语等的识别方法同后向模型o 调序方向相反21逆后向调序模型o 调序规则121221A XAstraightAA XAA A Xinverted1,AVP VVP2,APP TP SP12Xphrases between A and A22实验设计与结果o

8、baseline:u 利用我们实验室实现的基于短语的统计机器翻译系统o 利用单调的解码策略23实验设计与结果o 语料说明:表1:汉英翻译相关语料 表2:英汉翻译相关语料534 6句子数训练语料汉语32,4626英语32,4626开发集汉语534英语测试集汉语504325 7句子数训练语料汉语31,1438英语31,1438开发集汉语325英语测试集汉语49824实验设计与结果o 实验结果:表3:汉英翻译实验结果 表4:英汉翻译实验结果BLEU(%)BASELINE37.45STR40.18BLEU(%)BASELINE0.5037STR0.510525总结与展望o 句型信息对口语翻译的帮助非常大o 研究汉语的特点才能更有效地提高机器翻译质量26

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|