1、第六章第六章 现代汉字的字形现代汉字的字形 文字是记录语言的符号,字形是书面语言的承载体,或者说,字形是文字是记录语言的符号,字形是书面语言的承载体,或者说,字形是书面语言的物质形式。书写文字的一方和阅读文字的一方都以字形为媒介书面语言的物质形式。书写文字的一方和阅读文字的一方都以字形为媒介进行交际。字形的简易、明晰是双方进行书面交际的基本条件,字形的规进行交际。字形的简易、明晰是双方进行书面交际的基本条件,字形的规范是提高书面交际效率的重要保证。范是提高书面交际效率的重要保证。第一节第一节 现代汉字的简化和现代汉字的简化和整理整理 汉字标准化的内容之一是确定现代汉语用字的标准字形。汉字标准化
2、的内容之一是确定现代汉语用字的标准字形。2020世纪世纪5050年代年代以来所做的整理异体字、减少汉字笔画、统一印刷体字形等工作,都是在为以来所做的整理异体字、减少汉字笔画、统一印刷体字形等工作,都是在为汉字定形。汉字定形。一、现代汉字的简化 新中国成立以后,党和政府十分重视文字改革工作,建立了主管文字改革的专门机构,制定了积极而稳步地进行文字改革的方针,确定了简化汉字、推广普通话、制定和推行汉语拼音方案为当时文字改革的三项任务。u 汉字简化的方针是“约定俗成,稳步前进”。u 简化字的来源:有的是古字,或者是古本字,或者是古异体字,或者是古通用字;有的是群众中流传的简体字;有的是已经通行一个时
3、期的“解放字”或最近新造的字。u 简化字的简化方法:这8种简化方法是在使用汉字的长期历史中形成的,它符合汉字的简化规律,有着广泛的群众基础。u 简化字的影响:汉字简化取得了明显的效果,首先是减少了汉字的笔画,同时减少了通用汉字的字数。从汉字字形的表意表音作用来看,有很多简化字明显优于繁体字。由于简化,主要是由于草书楷化的运用,使汉字体系里增加了一些部件。换用简单的符号和同音替代的简化方法往往为人所诟病,但是平心而论,有许多情况还是合理的。u 注意简化原则。汉字的简化尽管以“约定俗成”为原则,但是只要有可能,还是要首先顾及整个构形系统的简化,不要为了各别字的简化而牵动了文字系统。u“简化十诫”:
4、二、现代汉字的整理 在整理汉字字形方面,新中国成立以来主要做了以下几件工作:整理异体字;整理印刷铅字字形,改换生僻地名用字;统一部分计量单位用字;颁布现代汉字通用笔画、笔顺规范。整理异体字u 异体字有两个含义:一是互为异体,即两个或几个音义相同但是形体不同的字互为异体;二是特指与正体字同音同义而写法不同的字。第一种含义适用于未经过整理的异体字,第二种含义适用于经过整理的异体字。u 整理异体字的原则是从俗与从简相结合,照顾书写方便。壹 整理印刷铅字字形 在字形没有整理之前,印刷体和手写体不统一,印刷体本身也不统一,给印刷厂增加麻烦,也给群众学习和使用汉字增加了负担。贰 1964年5月制订印刷通用
5、汉字字形表。该表收字形6196个,遵循从简从俗、便于学习和使用的原则,提供了通用汉字印刷字体(宋体)的标准字形,规定了表内字的笔画数目、笔画形状、笔画顺序和构件部位。它既是印刷字体的标准,也是写字教学的标准。印刷通用汉字字形表的发布对统一印刷字形,促进用字规范和方便中文信息处理都起到积极的作用。改换生僻地名用字u 必要性:我国幅员辽阔,地名繁多,其中有些地名用字生僻,对全国其他地区的人们来说比较生僻。此外,还有两种更改地名用字的情况:一种原因是汉字简化;另一种原因是异体字整理。u 取代生僻地名用字的标准:读音要相同;比较常用;简单易写;当地通行的比较合理的简易字;不跟已有的地名混同。叁 统一部
6、分计量单位用字u 1959年国务院发布关于统一我国计量制度的命令,确定以公制(米制)为基本计量制度。这是我国计量制度统一的重大措施。u 命令发布以后,在我国生产和科研等领域,英制计量制度基本上淘汰了,可是提到外国事物时,英制计量单位名称在语言、文字中还不能不使用,而这些计量单位的名称在语言和用字上存在着混乱。为了改变这种混乱状况,1977年7月20日文改会和国家标准计量局联合发出关于部分计量单位名称统一用字的通知,对部分计量单位名称用字作了统一规定。肆 颁布现代汉字通用字笔画、笔顺规范u 为了避免在应用中因理解和推断不同出现的汉字笔顺的不规范现象,促进我国语言文字规范化,消除规范笔顺本身存在的
7、难点,满足汉字研究、汉字教学、汉字信息处理、出版印刷和辞书编纂等方面的需要,国家语言文字工作委员会和新闻出版署决定对现行规范笔顺进行完善,形成了现代汉语通用字笔顺规范,并于1997年4月7日发布、施行。u 完善规范笔顺的具体内容有三个方面:一是在现代汉语通用字表的基础上,把隐性的规范笔顺变成显性的,列出了7000个汉字的跟随式笔顺;二是明确了字表中“火”“叉”等字的笔顺;三是调整了“敝”“脊”两个字的笔顺。伍 三、现代汉字字形规范的任务 现代汉字字形整理工作,过去几十年已经取得了很大的成绩,但是这项工作还没有全部完成。继续整理异体字u 异体字的范围:通过对第一批异体字整理表的分析,发现该表所收
8、异体字范围甚广,包括典型异体字、包孕异体字、交叉异体字、同音异义字、异音异义字五类。壹u 通用规范汉字表对第一批异体字整理表中确定的异体字进行了全面复查,把原来确定的异体字分为严格异体字和非严格异体字两类,分别予以处理。通用规范汉字表对部分异体字进行了新的调整,具体结果如下:整理异形词 异形词指的是普通话书面语中并存并用的同音、同义而书写形式不同的词语。例如,笔画/笔划,发人深省/发人深醒等。这些异形词在词典中一般注明通用。异形词的存在给现代汉语书面语的使用增加了负担,造成了混乱,因此有必要对异形词进行整理。贰u 异形词研究课题组在整理异形词时贯彻了三个主要原则,即:通用性原则、理据性原则、系
9、统性原则。通用性原则指的是,由于语言的约定俗成的社会属性,所以要根据科学的词频统计和社会调查,选取公众目前普遍使用的词形作为推荐词形。理据性原则指的是,如果某些异形词词频无显著性差异,难以根据通用性原则取舍,那就从词语发展的理据性角度推荐较为合理的词形。系统性原则指的是词汇内部有较强的系统性,在整理异形词时要考虑同语素系列用字的一致性。u 第一批异形词整理表。2001年教育部和语委颁发了第一批异形词整理表,作为语言文字规范推荐试行。词表根据“积极稳妥、循序渐进、区别对待、分批整理”的工作方针,选取了普通话书面语中经常使用、公众的取舍倾向比较明显的338组异形词作为第一批进行整理,给出了每组异形
10、词的推荐使用词形。通用规范汉字表遵循的字形标准u 通用规范汉字表所收的印刷通用汉字字形表和现代汉语通用字表之内的字,均按两表中字形收录。两表之外的字,依据两表内部的字形规则确定。在两个字表当中存在一些字形不统一的地方,如“木”单独成字或做偏旁时竖笔不带勾,处于字或部件的下部时,“朵、操、染、柒”等字不带勾,“杂、杀、条”等字带勾。u 这些没有理由的例外现象有必要进行规范,但是鉴于字形调整目前尚未得到社会的普遍认同,况且这一问题的彻底解决涉及宋体、仿宋体、楷体、黑体等多种常用印刷字体字形的规范,所以通用规范汉字表仍沿用原有的字形规范,暂不调整。叁第二节 现代汉字的结构系统 现代汉字的结构系统分为
11、笔画和笔顺、部件和字形两个层次。独现代汉字的结构系统分为笔画和笔顺、部件和字形两个层次。独体字是由笔画按照一定的书写顺序构成的,笔画是构成汉字的最小体字是由笔画按照一定的书写顺序构成的,笔画是构成汉字的最小单位。合体字是由部件按照一定的结构类型构成的,末级部件是由单位。合体字是由部件按照一定的结构类型构成的,末级部件是由笔画或笔画的组合构成的。笔画或笔画的组合构成的。一、笔画和笔顺 笔画指的是构成汉字的各种形状的点和线,在工整地书写楷书的时候,从落笔到提笔一次就叫一笔或一画。基本笔形及笔画变体u 传统上把汉字的基本笔画分为8种,即横、竖、撇、点、捺、提、钩、折。1965年公布的印刷通用汉字字形
12、表规定了5种基本笔画,即横、竖、撇、点、折。传统笔画中的“捺”被归并到“点”类,“提”被归并到“横”类,“竖钩”被归并到“竖”类,“竖钩”以外的所有复合笔画一律归到“折”类。壹 笔画数目和笔顺规则及笔画组合 通用汉字的笔画数目、笔形以现代汉语通用字表及现代汉语通用字笔顺规范为标准。五笔笔形横、竖、撇、点、折的数字代码分别是1、2、3、4、5。贰u 笔顺是指汉字笔画的书写顺序,它是人们在长期书写实践中形成的。一般来说,笔画的书写顺序建立在运笔方便的基础上,其基本规则可以概括为以下7项,见下表。在书写汉字时往往要综合运用这7项规则,除此之外,还有一些特殊的书写规则。有些字的笔顺不合一般规则,需要各
13、别掌握,如“女”、“火”、“半”等字。u 笔画构成汉字,除了单笔字之外,还有个笔画组合问题。按照现代汉字笔画与笔画之间的空间关系,可以划分出相离关系、相接关系、相交关系3种类型。汉字笔画数的分布情况u 笔画拥字量。在一个确定的汉字字符集中,每种笔画数有多少个汉字就叫该笔画数的拥字量。叁现代汉语 通 用 字 表 收 字7000个,平均每字10.75画。现代汉语通用字表收字笔画数统计表 辞海简化字和未简化字收集共11834字,平均每字11.5516画。辞海(1979年版)收字笔画数统计表比较 这两项统计反映了汉字的笔画数的分布情况。与现代汉语通用字表相比,辞海收字多出近5000字,这些字都没有简化
14、,不少是古代汉语用字,所以拥字量的高峰后移,平均笔画增多。从现实应用来看,汉字受到区别律和简易律两种规律的影响,尽管有简化的趋势,但是这种趋势并不是不受限制的。为了求区别,笔画数就不宜太少,如果笔画数太少,字形组合的方式就少,形似字就会增多。当然,笔画数也不宜过多,笔画过多不便应用,尤其是不便书写。在区别律和简易律的作用下,就形成了笔画集中在9画到12画之间的这种局面。汉字不同字符集的平均笔画u“高频趋简”现象。肆 对辞海和信息交换用汉字编码字符集基本集所收汉字进行统计,对6种字符集的平均笔画数进行比较。情况如下:从上表的统计可以看出,收字范围越大,平均笔画数就越高。相反,收字范围限定为常用字
15、或次常用字,它们的平均笔画数就越低。说明平均笔画与收字的使用频率成反比。这种状况符合汉字使用的规律,也和汉字简化工作有关。u 据汉字信息字典统计,汉字起笔笔形以横笔为最多,其次是撇笔、点笔和竖笔,最少的是折笔;汉字末笔笔形以点笔为最多,其次是横笔、竖笔、折笔,最少的是撇笔。了解了现代汉字起笔和末笔的统计数字,对于研究汉字的笔形排序和编制汉字笔形编码具有重要的参考价值。关于笔形的数字统计u 据文改会和武汉大学统计,辞海(1979年版)11834个正体字所包含的基本笔形的数字如下表所示。伍 从表中可知,横笔出现的频度最高,其次是竖笔、折笔、点笔,撇笔出现的频度最低。除横笔外,其他笔形出现的频度十分
16、接近。这形成汉字字形的两个特点:一是横笔多所以字形平衡稳重,二是其他笔形出现均衡有利于汉字字形的变化。二、部件和字形 为了把汉字输入电子计算机,并进行中文信息处理,人们根据各种各样的原则,把成千上万的汉字切分为几百个部件。部件及部件的组成类型壹部件是由笔画组成的具有组配汉字功能的构字单位。现代汉字部件之间的关系主要有相离和相接两种。部件分类例子成字部件村、杏、呆、困中的“木”;畔、畜、思、畏中的“田”非成字部件亩、卒、玄、六中的“宀”;塞、寒、襄中的基础部件功中的“工”“力”合成部件彩、踩、睬、菜中的“采”部件的不同的拆分原则 近几十年来,汉字编码方案层出不穷,对汉字字形有各种各样的切分,获得
17、的部件数也有很大的差异。产生分歧的主要原因是因为切分部件的原则不同:(1)是一次切分出最小部件,还是逐层切分,分级产生部件。(2)是纯粹按现代字形切分,还是根据造字理据切分。(3)怎样确定部件范围,不成字的笔画是否有资格成为部件?(4)笔画交重的多笔字是自成部件还是分解出更小的部件?贰 中国文字改革委员会和武汉大学合作用计算机对辞海(1979年版)的11834个正字进行自动分析统计。他们确定的部件必须由两笔或两笔以上的笔画结构构成,只有“乙”和部分参与构字的“一”除外。此外的单笔不能构成部件。按照以上原则,共切分出构字部件648个,其中成字部件327个,不成字部件321个。汉字部件规范 199
18、7年12月国家语言文字工作委员会颁布了信息处理用GB13000.1字符集汉字部件规范。该规范是根据汉字的构形规律、现行汉字的发展现实和汉字的历史承袭性,采用“从形出发、尊重理据、立足现代、参考历史”的原则制定的。叁u 汉字部件规范在进行部件拆分时首先考虑的是根据结构理据进行部件拆分,即有理据拆分,当无法分析理据或理据与字形发生矛盾时,则依照字形进行部件拆分,即无理据拆分。u 汉字按理据由若干个部件组合时有两种组合方式。一种组合方式为两部件组合,可以有若干个层次。大多数汉字采取的是这种多层次组合方式。另外的少部分汉字采取的是一次性多部件平面组合。例如:“湖”字和“蠢”字采取的是多层次组合,个层次
19、均为两部件。“器”字和“暴”字采取的是一次性多部件平面组合。u 拆分部件按部件组合的反方向进行。对层次结构的汉字递次进行有理据拆分,称层次拆分。对平面结构的汉字进行一次性的有理据拆分或无理据拆分,称平面拆分。u 具体的部件拆分的原则:不能违背形体遵照结构规律对应关系适度拆分,合理控制下限u 意义。汉字部件规范比较好地解决了部件拆分的原则,对中文信息处理,特别是对汉字键盘输入方法,具有规范作用,可用于中文信息处理领域的设计、管理、科研、教学和出版等方面,也可供汉字教学参考。字型结构及部件、部位的称谓u 部件与部件的组合存在着一定的结构形式,如果按照第一个层次结构来确定其类型,那么绝大多数汉字属于
20、左右结构、上下结构和内外结构。肆 3种结构之中,属于左右结构的汉字最多。3种结构之外,还有一些难于归类的属于特殊结构的字,人称框架结构,如“爽”“乘”“巫”“噩”等。u 部件和部位的名称的规定:成字部件的名称就读该字的读音,如果是多音字可以选择最常用的读音不成字部件中长期用来做偏旁的大多有习惯名称,如“宀”叫宝盖,等等。其中有多种名称的应选择最通行的说法。没有名称的应该确定一个通俗的、容易被群众接受的名称。u 为了便于称说,还要进一步确定汉字的部位名称,因为许多部件可以出现在不同的部位。根据部件在合体字中所处的位置,可以分析出8个部位,名称是上“头”下“底”,左“旁”右“边”,内“心”外“框”
21、,中“腰”四“角”。第三节 现代汉字的构字法 部件的提出与具体拆分主要是为了解决汉字编码输入电子计算机部件的提出与具体拆分主要是为了解决汉字编码输入电子计算机的问题,对拆分出来的末级部件只做纯形式的归纳,而丝毫不考虑的问题,对拆分出来的末级部件只做纯形式的归纳,而丝毫不考虑字音、字义。如果在分析汉字字形时要涉及字形与字所记录的词的字音、字义。如果在分析汉字字形时要涉及字形与字所记录的词的意义有什么关系,那么就要用到偏旁、部首、字符等概念。意义有什么关系,那么就要用到偏旁、部首、字符等概念。一、偏旁和部首u 偏旁是构成合体字的表意或表音的单位。构成会意字的两个或三个偏旁利用相互间的位置关系或意义
22、关系来表示词义。构成形声字的两个偏旁被分别称为形旁和声旁,形旁用来表示所记录的词的意义或类别,声旁用来表示词的读音。见下表:u 汉字的偏旁在小篆和小篆以前的古文字中全都能独立使用,而现行汉字的偏旁有些能够独立使用,有些不能独立使用。偏旁成字偏旁。能够独立使用的偏旁。不成字偏旁。现在不能独立使用的偏旁。u 构成会意字的两个或三个偏旁和形声字的形旁绝大多数是独体字。独体字是封闭性的,数量有限。形声字的声旁是开放性的,从构字原则上说,形声字可以用任何一个独体字或会意字作为形旁,也可以用形声字作声旁以构成新的形声字。见下表:正因为如此,形声字的声旁比形旁要多得多。u 偏旁系统的核心是部首。部首是具有字
23、形归类作用的偏旁,是按结构编排的字书中每部的首字。第一个创立部首检字法的是东汉的许慎。许慎说文解字。共540部,从部首的设立到各部的收字,遵循的是文字学的原则。明代梅膺祚字汇。以笔画多少为序建立部首,从1画到17画,列214部。文字归部“论其形,不论其义”,不再坚持六书原则,只根据楷书形体分别归入各部。字汇以后的字书,如康熙字典、中华大字典、老辞源、老辞海均采用214部,从部首的设立到各部的收字,遵循是检字法的原则。二、字符的提出与归类u 传统的六书是从字源上讲汉字的构字理据,它对于小篆和小篆以前的古文字是基本上适合的。汉字经过隶变,发展到楷书,再加上汉字简化,形体已经发生了很大的变化,所以现
24、行汉字的构字理据已经不适宜套用六书理论来分析了。见下表:u 语义及语音的古今变化也使得不少汉字偏旁的表意功能和表音功能有了改变。见下表:u 字符分析法。这种分析方法把语言的符号(文字)和文字的符号(字符)明确区分,并根据字符组字时的不同功能把字符分为意符、音符、记号。意符指的是和文字所代表的词在意义上有联系的字符。这种意义上的联系可能比较直接、具体,如“吠”由“口”和“犬”两个意符构成,表示狗叫;也有可能比较抽象、模糊,如“笔”由“竹”和“毛”两个意符构成,取毛笔的制造材料来表示写字画画的工具。音符指的是和文字所代表的词在声音上有联系的字符。形声字的声旁如果没有丧失表音功能,就是音符。如“扒”
25、“财”“袋”“泔”“伦”等字的声旁等,都具有强弱不同的表音功能,所以都是音符。记号指的是和文字所代表的词在意义上和声音上都没有联系的字符。见下表:u 字符的性质决定于字符在构字时所起的作用。同一个字符在不同的情况下所起的作用不同,归类也不同。见下表:三、现代汉字的4种基本类型u 根据现代汉字的形体及表意、表音功能,现代汉字可以归纳为4种基本类型,即记号字、半记号字、表意字和意音字。记号字合体记号字独体记号字半记号字半意符半记号字半音符半记号字表意字独体表意字合体表意字意音字现 代 汉 字现代汉字构成方式一览表思考与练习一、简要说明汉字的简化方针。二、举例说明汉字的简化方法。三、汉字简化有哪些主要的经验和教训?四、新中国成立以来,政府在整理汉字字形方面做了哪几方面的工作?五、整理异体字的原则是什么?六、整理异形词的原则是什么?七、什么叫“高频趋简”?原因是什么?八、汉字部件规范拆分汉字的原则是什么?九、以说文解字的540部、字汇的214部、汉字部首表的201部为例,说明部首检字法的发展变化。十、按照字符理论应该如何分析和归纳现代汉字的结构类型。