1、南京大学南京大学汉语中介语口语语料库汉语中介语口语语料库建设概况建设概况NANJING UNIVERSITYCONTENTS 一、建设背景一、建设背景 二、建设理念二、建设理念 三、建设目标三、建设目标 四、建设现状四、建设现状 五、数据库主要功能(征求意见中)五、数据库主要功能(征求意见中)一、建设背景一、建设背景近年来,汉语中介语语料库在语言教学和研究中所起的作用日益受到学界的重视,汉语中介语语料库建设有了较快发展。目前国内已有多家高校建成了一定规模的汉语中介语语料库,不但为汉语教学和研究提供了丰富的语料,也为语料库的建设积累了宝贵的经验。但从目前已建成的语料库来看,基本上都属于共时笔语语
2、料库,即采集的语料为学习者的横向书面写作语料,相比较而言,口语的和纵向的语料仍十分缺乏。而近年来对留学生的口语能力表现、语音语调学习难点分析、习得习惯、语音或语流发展等方面的研究越来越多,而基于口语语料的实证研究能较好地满足这方面的教学和研究需求。建设背景建设背景 近期随着学界开始用“二语发展”概念(能揭示二语学习是一个兼具生长和下降,即习得和耗损双向的、充满变异的、非线性的发展过程)取代传统的、单向的、线性发展的“二语习得”概念,以及相关新兴理论(如新互动理论、变异理论、社会文化理论、动态系统理论等)的深入发展,加上对外汉语教学界日益重视外国学生汉语语音声调韵律等学习难点分析、汉语口语中介语
3、对比分析、汉语口语能力的多维表现、以及汉语口语动态发展过程和规律等方面的研究,学界迫切需要建设新型汉语中介语口语语料库以满足上述研究需求以及解决在口语教学上的应用问题。二、建二、建设设理念理念基本理念:基本理念:建设一个多母语背景的、可展示汉语多维动态发展的汉语中介语口语语料库。、就人类语言的发展进程来说,书面语的出现远比口语要晚。从儿童语言的个体发展进程来看,也是先学会口语,后学习书面语。因此就语言的本质来说,口语是第一性的。口语和书面语作为两种不同的交际方式,服务于不同的交际目的,两者各有自己的特点,不可能互相取代。自然口语中除了字、词、句以外,还包括韵律和语调、说话者边想边说的种种措辞的
4、心理表征以及语法和语用的标记。我我们的目标是建立音文同步的口语语料库。们的目标是建立音文同步的口语语料库。、二语习得是一个动态的发展过程,学习者并非从目的语规则的“零知识”突然跳跃到对规则的完美习得,而是要通过一系列的发展过渡阶段才能到达彼岸。通过收集纵向追踪语料,可以对二语学习者获得第二语言能力的渐进过程做出准确的描述,研究贯穿整个学习过程的二语发展步骤和模式,可以帮助我们认识二语习得规律,在规划和实施二语教学活动时,把握二语发展中的关键转变点或临界点。因此,对于研究汉语二语习得过程,既需要截面数据,也需要纵向数据,纵向追踪语料库起着共时语料库难以替代的作用。我们收集的语料基本上是具有可比性
5、的纵向发展语料。、汉语中介语系统的发展是一个使用准确度、表达流利度、结构复杂度和类型变化度等多方面协同发展的过程,一个熟练的说话者能够采用复杂的结构、丰富的词汇和格式流利准确地运用语言。本语料库中的语料将能展示口语表现的多维特征。本语料库中的语料将能展示口语表现的多维特征。三、建设目标三、建设目标 建设一个多母语背景的、可展示汉语多维动态发展的汉语中介语口语语料库 实现实现音文分开或音文同步在线检索 建设与口语发展语料联动的学习者个体因素和环境因素子数据库 建设一个动态与静态共存、教学与研究并用、全球合作共享的口语语料库四四、建设现状、建设现状一、已完成第一阶段语料收集工作 1.上述语料的文字
6、转写工作大部分已经完成,已经转写了400多个小时,约200万字的语料;2.声调韵律的分析和显示工具已初步研制成功。3.如何利用这些语料进行各种相关研究已经做了尝试,并取得了一系列研究成果。南京大学汉语南京大学汉语中介语中介语口语语料库口语语料库已收集的数据主要有以下几种类型(1)外国学生独白式的口语语料外国学生独白式的口语语料:每学期两次以专门话题为任务,在语音实验室统一由计算机集体采集的个人口语测试语料,共300人,约300个小时的录音语料。(2)汉语母语者与外国学生的对话语料汉语母语者与外国学生的对话语料:对外国留学生进行为期半年到1 年的自然谈话高密度跟踪录音语料,由语料采集者与外国学生
7、模仿OPI的方式进行自然对话,采集20多名外国学生,约300 多个小时的多波跟踪录音语料。()外国学生之间的对话语料外国学生之间的对话语料:外国学生与外国学生在自然环境下的谈话语料,采集了30多名外国学生之间,共约100多个小时的自然谈话语料。()学习者背景信息数据学习者背景信息数据:包括学生的性别、年龄、国籍、母语背景、汉语学习经历、汉语水平等。()学习者其他方面的关联数据学习者其他方面的关联数据:已收集了口语语料库中部分学习者的学习策略、学习焦虑、纠错反馈信念等方面的联动数据。今后中介语语料的采集不仅是语料的收集,同时也要通过精心设计,有计划、有重点、分步骤地采集影响中介语发展的相关变量信
8、息。第二阶段工作(2016-2017)1.继续搜集口语纵向语料和相关联动数据2.继续进行文本转写和全语料标注3.设计相关的语料库软件3.建设语料库数据库(网站)4.内部试运行(在线检索)5.试开通语料库网站(2017下半年)五、数据库主要功能五、数据库主要功能征求意见中试用情况试用情况例:欧美国家初级水平汉语学习者声韵母学习难点研究 中级水平留学生汉语口语学习策略与学习效果相关性研究 留学生口语流利度与语块输出量之间的关系探究 中级汉语留学生口语学习策略与学习效果相关性研究 日、韩留学生汉语语音习得僵化现象研究Contact InformationProf.Cheng AiminInstitute for International StudentsNanjing UniversityNanjing 210093,ChinaTel:+86 25 8359 2875Email: