1、短语结构制导的范畴表达式演算白 硕 赵章界中国科学院计算技术研究所2004年7月有一种东西叫意义?符号,最根本的属性是“牺牲自己、代表别人”语义学,顾名思义,研究的是符号的意义,也就是被符号代表的那个“别人”,即它的“所指”如果符号和它的意义完全同构,研究符号本身就足够了,可惜即使在数学中,这一点都做不到 在自然语言中,不确定的指称、不确定的角色指派、失败的举一反三,让我们寄希望于意义不确定的指称符号的世界意义的世界鸡鸡鸡 不吃了停止了进食不吃这种食物了不确定的角色指派张三找李四去坦白交待张三找李四去坦白交待张三找李四去坦白交待不成功的举一反三看了三天就腻了看了三天就忘了开始看腻了看完了忘了计
2、算机处理语言一定需要意义?计算机处理自然语言,面对着各个层次上的不确定性 之所以需要意义和(传统意义上的)语义学,正是由于这些不确定性 直接在这些不确定性的驱动下设计具有恰当区分能力的标签(标注)体系,在这一过程中不排除借鉴意义的世界中的若干要素,可能是一种更有效的做法“权宜的”语义学 我无需关心意义的世界到底有什么 我无需努力去“重构”意义的世界,为它建立什么模型 我只需为大大小小的符号串贴一些“人为的”、“权宜的”标签,在这种标签之间定义一种演算,做到:我们在意义的世界里感受到多少种不确定的指称,这种演算一定会给出多少套不同的标签 我们在意义的世界里感受到多少种不确定的角色指派,这种演算一
3、定会在标签之间建立多少种结构制约关系那么,从计算的角度看,这种演算就可能是成功的这种标签演算体系应该 有层次(反映标签之间的上下位关系)有结构(反映成分间基于标签的结合关系)有运算(构造正确的标签组合)有约束(构造时满足并传播特定约束条件)有弹性(利用结构中满足特定条件的标签)有顺序(利用标签在结构中的顺序信息)范畴表达式演算正中下怀 有层次(偏序)有结构(带空穴的复杂标签)有运算(特化、泛化、约分)有约束(填入空穴时的匹配约束,空穴与其他标签的绑定约束,句法规则对填入空穴的方式的约束)有弹性(可以指定与标签匹配的空穴)有顺序(可以指定与标签匹配的左数/右数第几个空穴)有层次基本范畴的继承关系
4、topentityrelationeventbooleanobjmentalanimatefoodhuman基本范畴集合和它上面的偏序关系构成一非空的、可数的、有界完备的偏序集合有结构复杂范畴如果a,b1,b2,bn是范畴,那么a/b1,b2,bn也是范畴,其中a称为中心范畴,b1,b2,bn称为空穴b1b2bna空穴如果一个复杂范畴的空穴被相应范畴或其特化范畴所填充,那么这个复杂范畴就变成它的中心范畴有运算特化与泛化在基本标签集合中,下位标签与上位标签可进行特化()运算,结果为下位标签。例如:Entity human=human在基本标签集合中,任何两标签可进行泛化()运算,结果为二者的最小
5、公共上位标签,也就是说,基本标签集合和它上面的泛化运算构成一半格。例如:Human food=obj有运算约分Event/animate,foodanimatefood*animatefoodEvent/animate,foodevent类比:物理学中的“量纲”有约束继承、绑定、规则引入了偏序结构上的约分机制,扩充了约分对象引入了范畴之间的绑定关系,借鉴中心词的继承,扩充了约分效果的影响范围引入了短语结构制导机制,利用短语结构规则对范畴的限定关系,缩小了候选约分运算的范围取消了范畴语法中机械依赖语序的左右除法和左右约分绑定约分绑定约分利用下标,解决约分过程中范畴之间的同步关系背景:中心词从分母
6、向分子传播,以及长距离相关红obj/obj太阳astro*剩下的是obj,不是astro!红obj/obj太阳astro*增加了下标以后,所有下标相同的范畴表达式要同步地刷新特化结果都变成astro短语结构制导的约束规则句法层的强制约束,可以传导到范畴表达式演算中来,缩小演算中的不确定范围谁跟谁约分?好entity/entity爸爸human/human*一个好人的爸爸好entity/entity爸爸human/human*一个人的爸爸是好的NPentity*APentity/entity NPentity/C()空成分负载结构的情况联合结构“爸爸妈妈”这个短语结构的范畴表达式,既不负载在“爸
7、爸”上面,也不负载在“妈妈”上面,而是负载在整个短语结构上面NPentityNPentity nullentity/entity,entity NPentity爸爸human/human妈妈human/human空成分负载结构的情况述补结构述补结构的范畴表达式,既不负载在述语上面,也不负载在补语上面,而是负载在整个短语结构上面VPBoolean/C()VEvent/C(Entity)Null(Boolean/C(Entity)/(Event/C(Entity),Boolean/Entity ABoolean/EntityVEvent/C(entity)ABoolean/entity有弹性,有顺
8、序定位因子从范畴表达式的抽象“分母”上提取特定类型的空穴进行约分运算了:(boolean/C()/(relation/C()(只表示抽象分母)把:(Event/C()/Entity,Event/C(Entity)(从抽象分母中提取右数第一个Entity范畴)被:(Event/C()/Entity,Event/C(Entity)(从抽象分母中提取左数第一个Entity范畴)理论渊源 范畴语法 配价理论 类型-逻辑语义学 依存语法短语结构如何制导 主谓结构 述宾结构 述补结构 联合结构 偏正结构(定中)偏正结构(状中)介宾结构 连谓结构(连动)连谓结构(兼语)双宾结构 的字结构 把字结构 被字结构
9、 给字结构 在字结构 所字结构 时态结构 数量结构王冕死了父亲王冕NPhuman死Vevent/animate了了boolean/relation父亲NPhuman/human死了VP/boolean/animate死了父亲VP/boolean/human时态述宾王冕死了父亲S/boolean主谓台上坐着主席团台上NPplace坐Vevent/animate着着boolean/relation主席团NPhuman坐着VPboolean/animate坐着主席团VPboolean时态述宾台上坐着主席团Sboolean主谓Nullboolean/place,boolean卖盐的卖Vevent/hu
10、man,human,obj 盐Nobj的的entity/(relation/C(entity)卖盐VPevent/human,human卖盐的Shuman/human述宾的字我是县长派来的我NPHuman是Vboolean/entity,entity县长NPhuman派V(event/C()/human,human,relation/C(human)来Vevent/mobile的的 entity/(relation/C(entity)派来VPevent/human,human县长派来VPevent/human县长派来的NP human)主谓述补的字是县长派来的VPboolean/entity我
11、是县长派来的Sboolean述宾主谓这些馒头把我吃胖了这些馒头NPfood把:(relation/C()/Entity,relation/C(Entity)我Nhuman吃Vevent/animate,food胖Aboolean/animate了了boolean/relation吃胖VPboolean/animate,food吃胖了VPboolean/animate,food把我吃胖了VPboolean/food把我PP(relation/C()/relation/C(Human)这些馒头把我吃胖了VPboolean主谓状中介宾时态述宾他被地主放狗咬了被:(relation/C()/Entit
12、y,relation/C(Entity)放V(event/C()/human,animate,relation/C(animate)狗NPanimate咬Vevent/animate,entity地主NPhuman介宾了了boolean/relation咬了VPboolean/animate,entity放狗咬了VP(event/entity)/human被地主:(relation/C()/human,relation/C(human)被地主放狗咬了:event/entity 他NPhuman被地主放狗咬了:event时态 兼语 状中 主谓语义指向树砍光了树NPplant砍Vevent/Hum
13、an,obj,tool光Aboolean/entity了了boolean/relation砍光VPboolean/human,obj,toolNull(Boolean/C(Entity)/(Event/C(Entity),Boolean/Entity砍光了VPboolean/human,obj,tool树砍光了Sboolean/human,tool语义指向他砍累了他NPhuman砍Vevent/Human,obj,tool累Aboolean/animate了了boolean/relation砍累VPboolean/human,obj,toolNull(Boolean/C(Entity)/(Ev
14、ent/C(Entity),Boolean/Entity砍累了VPboolean/human,obj,tool他砍累了Sboolean/obj,tool语义指向刀砍钝了刀NPtool砍Vevent/Human,obj,tool钝Aboolean/tool了了boolean/relation砍钝VPboolean/human,obj,toolNull(Boolean/C(Entity)/(Event/C(Entity),Boolean/Entity砍钝了VPboolean/human,obj,tool他砍累了Sboolean/human,obj,泛化运算的消岐作用张三NPhuman和 和entity entity/entity,entity李四NPhuman的的entity/entity书包NPstationary张三和李四NPhuman李四的书包NPstationary张三和李四的书包NPstationary张三和李四的书包NPobj总结 我们提出了一套标签演算体系 它继承了范畴语法、配价理论、类型-逻辑语义学、依存语法的优点 它可以在传统的表层语法框架内,更好地捕捉成分之间相互作用,从不确定的指称、不确定的角色指派中最终筛选出接近直观的结果 它有明确的、可检验的计算机制Thanks.Any question?请发邮件至 与我联系