1、11.1 信息及其特征信息及其特征回顾1、信息无时不在、无处不在,信息是我们生存的基础,也是我们行动和决策的重要依据;2、,和 是人类社会的三大要素;3、信息的特征:信息具有的特性有好多,如,等等。物质能源信息载体依附性时效性共享性价值性传递性真伪性1.2 信息的编码信息的编码计算机电路板计算机电路板计算机电路图计算机电路图1.2 信息的编码信息的编码 信息本身是看不见摸不着的,但是它可以用一定的方式表现出来。通常我们把用来表示信息的符号组合叫做信息的代码。生活中常见的编码:语言(普通话,方言,哑语)文字(汉字,英语,盲文)符号与图形(各种交通指示图案,)在使用计算机进行信息处理时,首先要对信
2、息进行编码,把问题转化成二进制代码的计算问题。要是计算机能够处理文字、声音、图像和视频等信息,采用正确的编码方法是首先要解决的问题之一。十进制代码的特征十进制代码的特征现实生活中我们用的最多的十进制,十进制数的构成特点:1、有十个基本数码:0、1、2、3、4、5、6、7、8、9。2、采用逢十进一的进位规则。例:23表示二个10和三个1的和,展开为2X101+3X100=233、每个数码在不同的数位上,对应不同的权值。例:432:第一位个位个位为2,权值为100,实际值为2X100,表示二个,第二位十位十位为3,权值为101,实际值为3X101,表示三十,第三位百位百位为4,权值为102,实际值
3、为4X102,表示四百,十进制代码的特征十进制代码的特征十进制数543210分解真实大小的计算:5X105+4X104+3X103+2X102+1X101+0X100543210即五十四万三千二百一拾十进制代码的运算十进制代码的运算167+46213 1 6 7+4 6 2 1 3逢十进一逢十进一1677889 1 6 7 7 8 8 9借一当十借一当十日常生活中的其它进制数的应用日常生活中的其它进制数的应用七进制:一星期有七天十二进制:一年有十二个月二十四进制:二十四小时制三十进制:一月有三十天六十进制:一小时有六十分,一分有六十秒十六进制:便于信息的表达而特设的十六进制:便于信息的表达而特
4、设的常用的进制数及其标识常用的进制数及其标识:二进制为计算机特有专用的数制,十进制为人们所熟悉的数制,八进制与十六进制为方便信息的表示而设置的。世界上最早的二进制:阴阳八卦八卦起源于5000千年前三皇五帝之首的伏羲,伏羲氏在陕西天水卦台山始画八卦。八卦表示事物自身变化的阴阳系统,用“一”代表阳,用“-”代表阴,2000多年前出现的系辞传记载:“是故易有太极,是生两仪,两仪生四象,四象生八卦,八卦定吉凶,吉凶生大业。”交代了八卦按照一分为二的方式禅释自然。是为世界上最早的二进制。乾qin、坤kn、震zhn、巽xn、坎kn、离l、艮gn、兑du。计算机中采用二进制数存储信息n冯诺依曼(公认为电脑之
5、父)n计算机系统结构(冯诺依曼结构)原理:存储程序和程序结构 n提出:计算机内的信息,包括数据和程序应计算机内的信息,包括数据和程序应 采用二进制代码表示。采用二进制代码表示。信息代码用统一的二进制数字编码,计算机才能识别和处理。1.2 信息的编码信息的编码开关断开状态灯暗状态为开关闭合状态灯亮状态为简单的电路控制原理图(开关电路)计算机电路的基本构成为高速开关电路,一般设定断电计算机电路的基本构成为高速开关电路,一般设定断电状态为状态为0,通电状态为,通电状态为1。计算机内信息分为两种:数值和数据计算机内信息分为两种:数值和数据数值:比较大小,可进行数学运算的信息数值:比较大小,可进行数学运
6、算的信息数据:符号,文字,控制,图形,声音,视频等信息数据:符号,文字,控制,图形,声音,视频等信息1110 1000 0111 0100 0111 0000 01011000 0111 0111 0000 0100 0101 01000100 0101 0100 1000 0111 0100 0011 0110 0100 0101 0100 0111 0100 0110 1010 0111 0111 0000 0100 0101 01000100 0101 0100 1000 0111 0100 0101有以上这样的一个二进制数读起来方便吗?有以上这样的一个二进制数读起来方便吗?书写起来方便
7、吗?方便记忆吗?书写起来方便吗?方便记忆吗?计算机内的信息计算机内的信息二进制代码的特征二进制代码的特征 计算机采用二进制代码可以方便地存储、处理和传送信息。二进制记数系统的特点是:二进制记数系统的特点是:1、有两个基本数码:、有两个基本数码:0、1。2、采用逢二进一的进位规则。、采用逢二进一的进位规则。3、每个数码在不同的数位上,对应不同的权值。、每个数码在不同的数位上,对应不同的权值。权值为权值为2n1(n为当前位数)为当前位数)在信息科技中,特别是在计算机领域,“代码”两个字具有特指性,是指用“0”、“1”两个符号组成的数字代码。1二进制转化为十进制:每一位系数乘上2(n1)次(n为当前
8、位数)。称为按权展开法(按权展开法(也称为法)法)例:把二进制数10010转化成十进制:二进制转化成十进制数的方法:按权展开按权展开法法(10010)2(18)10(18)10十进制与二进制转换:除二取余法除二取余法2十进制转化为二进制:除二取余除二取余,直到商为0,由下往上,把余数组合即得二进制数,如把十进制数(11)10化成二进制数:因此,十进制数(11)10的二进制是(01011)2 。即为(1011)22 11 10 0 2 5 12 2 02 1 1余数商由下往上,把余数组合即得01011除数二、十进制数的互相转换:二、十进制数的互相转换:p 十进制-二进制:除二取余法,除二取余法,
9、示例:示例:4322121021125022121001除到商是除到商是0为止为止从从下下自自上上排列排列(43)10=(1 0 1 0 1 1)2课堂练习课堂练习:1、把下面的十进制数转换成二进制:31D 64D 21D2、把下面的二进制数转换成十进制:1000B 1111B 11010B=11111B=11111B =1000000B =1000000B =10101B=10101B=8D=8D =15D =15D =26D=26D1 1、信息的编码即采用一定的标准把不可见的信息直观表达;、信息的编码即采用一定的标准把不可见的信息直观表达;2 2、计算机的编码就是把输入计算机的信息全部数字
10、化,也即转化为二进制数;、计算机的编码就是把输入计算机的信息全部数字化,也即转化为二进制数;3 3、二进制编码在计算机内方便表达,存储,处理,电路简单;、二进制编码在计算机内方便表达,存储,处理,电路简单;4 4、十进制编码的编码规则:、十进制编码的编码规则:5 5、二进制编码的编码规则:、二进制编码的编码规则:6 6、二,十进制的互换规则:、二,十进制的互换规则:本节小结本节小结p二进制数特点:1、两个基本数码:0,1;2、逢二进一,借一当二。3、每个数码在不同的数位上对应着不同权值,权值为2n-1p十进制数特点:1、十个基本数码:0、1、2、3、4、5、6、7、8、9 2、逢十进一,借一当
11、十。3、每个数码在不同的数位上对应着不同权值,权值为10n-1p二,十进制转换:按权展开法按权展开法p十,二进制转换:除二取余法除二取余法1 1、信息的编码即采用一定的标准把不可见的信息直观表达;、信息的编码即采用一定的标准把不可见的信息直观表达;2 2、计算机的编码就是把输入计算机的信息全部数字化,也即转化为二进制数;、计算机的编码就是把输入计算机的信息全部数字化,也即转化为二进制数;3 3、二进制编码在计算机内方便表达,存储,处理,电路简单;、二进制编码在计算机内方便表达,存储,处理,电路简单;4 4、十进制编码的编码规则:、十进制编码的编码规则:5 5、二进制编码的编码规则:、二进制编码
12、的编码规则:6 6、二,十进制的互换规则:、二,十进制的互换规则:上节回顾上节回顾p二进制数特点:1、两个基本数码:0,1;2、逢二进一,借一当二。3、每个数码在不同的数位上对应着不同权值,权值为2n-1p十进制数特点:1、十个基本数码:0、1、2、3、4、5、6、7、8、9 2、逢十进一,借一当十。3、每个数码在不同的数位上对应着不同权值,权值为10n-1p二,十进制转换:按权展开法按权展开法p十,二进制转换:除二取余法除二取余法1二进制转化为十进制:每一位系数乘上2(n1)次(n为当前位数)。称为按权展开法(按权展开法(也称为法)法)例:把二进制数10010转化成十进制:二进制转化成十进制
13、数的方法:按权展开按权展开法法(10010)2(18)10(18)10回顾二、十进制数的互相转换:二、十进制数的互相转换:p 十进制 转换为 二进制的方法:除二取余法,除二取余法,示例:示例:4322121021125022121001除到商是除到商是0为止为止从从下下自自上上排列排列(43)10=(1 0 1 0 1 1)2回顾十六进制与二进制的转换十六进制与二进制的转换十六进制代码的特征十六进制代码的特征1、有十六个基本数码:2、采用逢十六进一的进位规则。3、每个数码在不同的数位上,对应不同的权值。4、十六进制转换为十进制:按权(权值为按权(权值为16n)展开法)展开法,5、十进制转换为十
14、六进制:除十六取余法。除十六取余法。例:1、把(3D)H转换为十进制数 2、把(48)D转换为十六进制数从从下下自自上上排列排列1648160除到商是除到商是0为止为止(48)D 0 3 0=30H十六进制数等于十进制的十六进制数等于十进制的十六进制与十进制转换:按权展开法按权展开法十进制与十六进制转换:除除16取余法取余法 二进制数不便于书写和记忆,人们经常采二进制数不便于书写和记忆,人们经常采用十六进制来表示他们。转换方法为:每用十六进制来表示他们。转换方法为:每4 4位位二进制数可以用二进制数可以用1 1位十六进制数表示。位十六进制数表示。二进制与十六进制转换:分组转换法分组转换法例:把
15、下列二进制转换为十六进制11110000B1010110B 例:把下列十六进制转换为二进制 4H6H1111,00000101,0110 0101,011056转化规则:从低位开始取位一组,不足位则高位加转化规则:从低位开始取位一组,不足位则高位加补足位,每组对应等于十六进制的一位补足位,每组对应等于十六进制的一位1110,0100111001000110,1100 1101100转化规则:位十六进制数对应位二进制数,中间转化规则:位十六进制数对应位二进制数,中间0不不能舍去,高位能舍去,高位0可以舍去。组合成二进制数。可以舍去。组合成二进制数。训练:把下列二进制转换为十六进制11010010
16、B 1111011B 111000B训练:把下列十六进制转换为二进制 B2H 7FH 1AH11010010B=1101,0010B=D2H1111011B =0111,1011B=7BH111000B =0011,1000B=38HB2H =1011,0010B=10110010B 7FH =0111,1111B=1111111B1AH =0001,1010B=11010B 1、现代社会中,人们把()称为构成世界的三大要素。A、精神、物质、知识B、财富、能量、知识C、物质、能量、知识D、物质、能量、信息2、下列不属于信息的是()A、报上登载举办商品展销的消息 B、电视中某产品广告 C、石油
17、D、各班各科成绩n3、下面有关对信息的理解,哪句是错误的()A、在一定程度上,人类社会的发展速度取决于人们感知信息、利用信息的广度和深度 B、信息无时不在,无处不在,信息是我们行动决策的重要依据 C、电视机、电话机、声波、光波是信息 D、人类可以借助信息资源对自然界中有限的物质资源和能量资源进行有效地获取、分配和利用n4、关于信息的下列说法中,正确的是()nA、网络就是信息nB、报上登载的足球赛的消息是信息nC、一本书就是信息 nD、收音机就是一种信息5、甲骨文是考古工作者了解商周时期文化历史的重要物证。文字刻在甲骨上说明信息具有()特征。A、时效性B、载体依附性C、共享性D、价值性是()nA
18、、同一信息可以同时依附于多种载体nB、信息必须依附于一定的载体nC、某些信息可以不用依附于载体nD、电波是信息的一种载体n7、在朝鲜战争即将爆发的时候,蓝德公司开价150万美金向美国政府兜售一份调查报告没被理会,战后美国政府分文未花就得到该报告,这主要体现了信息的()nA、时效性B、可传递性nC、真伪性D、价值性n8、网络上的信息被大家下载和利用,此事例不能说明信息具有()nA、价值性nB、正确性nC、载体依附性nD、共享性n9、某医院的多名医生和护士,在为某一名垂危病人做手术时,通过一些医疗监视设备了解病人的心电图、血压等情况,从而采用不同的救治措施,最后成功挽救了病人的生命。我们知道,信息
19、的特征有:载体依附性;价值性;时效性;共享性:真伪性。n在这个事例中,体现了信息的()nA、B、nC、D、课堂练习2n完成下列数制之间的转换 11010010B=D=H 01111111B=D=H 4A9 H=B 64D=B=H2102127710010101001100000040 二进制数不便于书写二进制数不便于书写和记忆,人们经常采用十和记忆,人们经常采用十六进制来表示他们。六进制来表示他们。转换方法为:转换方法为:每每4 4位二进制位二进制数可以用数可以用1 1位十六进制数表位十六进制数表示。示。二二十六进制转换:十六进制转换:分组转换法分组转换法十六十六二进制转换:二进制转换:分组转
20、换法分组转换法本节小结本节小结分组转换法分组转换法 二进制数不便于书写二进制数不便于书写和记忆,人们经常采用十和记忆,人们经常采用十六进制来表示他们。六进制来表示他们。转换方法为:转换方法为:每每4 4位二进制位二进制数可以用数可以用1 1位十六进制数表位十六进制数表示。示。二二十六进制转换:十六进制转换:分组转换法分组转换法十六十六二进制转换:二进制转换:分组转换法分组转换法上节回顾上节回顾分组转换法分组转换法11010010B=1101,0010B=D2H1111011B =0111,1011B=7BH111000B =0011,1000B=38HD2H =1101,0010B =1101
21、0010B 7FH =0111,1111B=1111111B1AH =0001,1010B =11010B 回顾216进制转换:进制转换:分组转换法分组转换法:从低位往高位,四位一组,不足从低位往高位,四位一组,不足四位,高位加四位,高位加0,凑足四位,分别转换为一位,凑足四位,分别转换为一位16进制数。进制数。162进制转换:进制转换:分组转换法分组转换法:每位每位16进制数转换为四位进制数转换为四位2进制进制数,转换完成,把高位的数,转换完成,把高位的0去掉。去掉。1.2.2 字符编码字符编码前面我们学习的是计算机数值编码,是用前面我们学习的是计算机数值编码,是用来科学计算的。接下来我们将
22、学习计算机来科学计算的。接下来我们将学习计算机内的数据编码,常见的数据包括字符,汉内的数据编码,常见的数据包括字符,汉字,图形,声音,视频等各种信息。字,图形,声音,视频等各种信息。二进制表示信息的规则二进制表示信息的规则一盏灯可以表示多少个信号?二盏灯可以表示多少个信号?灯亮为灯亮为1、灯灭为、灯灭为0可表示可表示1、0二个信号二个信号可表示可表示00、01、10、11四四个信号个信号即即21=2个信号个信号即即22=4个信号个信号二进制表示信息的规则二进制表示信息的规则可表示可表示0000、0001、0010、0011、0100、0101、0110、0111、1000、1001、1010、
23、1011、1100、1101、1110、1111,十六个信号十六个信号四盏灯可以表示多少个信号?0、10、10、10、1即即24=16个信号个信号二进制表示信息的规则二进制表示信息的规则即即28=256个信号个信号思考:思考:8盏灯可以表示多少个信号?盏灯可以表示多少个信号?10盏呢?盏呢?即即210=1024个信号个信号20=1个信号个信号21=2个信号个信号22=4个信号个信号23=8个信号个信号24=16个信号个信号25 =32个信号个信号26 =64个信号个信号27 =128个信号个信号28 =256个信号个信号29 =512个信号个信号210 =1024个信号个信号计算机内字符(英文
24、、数字等)的编码计算机内字符(英文、数字等)的编码n常见的英文字符有:常见的英文字符有:n大写字母:大写字母:A、B、C、DZ,n小写字母:小写字母:a、b、c、d、z,n数字:数字:0、1、2、9,n控制符号控制符号n标点符号标点符号n其它符号其它符号n52个大小写字母,个大小写字母,10个数字字符,个数字字符,32个标点及其它符号,个标点及其它符号,34个控制符,共计个控制符,共计128个,即个,即128种编码符号种编码符号思考:用二进制表示思考:用二进制表示128种编码符号,需几位二进制位?种编码符号,需几位二进制位?27 =128计算机内字符(英文、数字等)的编码计算机内字符(英文、数
25、字等)的编码n计算机内普遍使用的字符编码计算机内普遍使用的字符编码:n ASCII码码(美国信息交换标准码美国信息交换标准码)nAmerican Standard Code for Information Interchange图形字符图形字符(94):):33-126控制字符控制字符(34):):0-32,127大小写字母:大小写字母:52个个数字符号:数字符号:10个个标点符号:标点符号:32个个ASCII码字符编码表组成码字符编码表组成计算机内字符(英文、数字等)的编码计算机内字符(英文、数字等)的编码Bin Dec Hex 缩写缩写/字符字符 解释解释0000 0000 0 00 NU
26、L(null)空字符空字符0000 0001 1 01 SOH(start of handing)标题开始标题开始 0000 0010 2 02 STX(start of text)正文开始正文开始 0000 0011 3 03 ETX(end of text)正文结束正文结束0000 0100 4 04 EOT(end of transmission)传输结束传输结束 0000 0101 5 05 ENQ(enquiry)请求请求 0000 0110 6 06 ACK(acknowledge)收到通知收到通知 0000 0111 7 07 BEL(bell)响铃响铃0000 1000 8 0
27、8 BS(backspace)退格退格 0000 1001 9 09 HT(horizontal tab)水平制表水平制表符符 0000 1010 10 0A LF(NL line feed,new line)换行键换行键 0000 1011 11 0B VT(vertical tab)垂直制表垂直制表符符 0000 1100 12 0C FF(NP form feed,new page)换页键换页键ASCII编码 控制码0-31 Bin Dec Hex 缩写缩写/字符字符 解释解释0000 1101 13 0D CR(carriage return)回车键回车键0000 1110 14 0E
28、 SO(shift out)不用切换不用切换 0000 1111 15 0F SI(shift in)启用切换启用切换 0001 0000 16 10 DLE(data link escape)数据链路转数据链路转义义 0001 0001 17 11 DC1(device control 1)设备控制设备控制1 0001 0010 18 12 DC2(device control 2)设备控制设备控制2 0001 0011 19 13 DC3(device control 3)设备控制设备控制3 0001 0100 20 14 DC4(device control 4)设备控制设备控制4 00
29、01 0101 21 15 NAK(negative acknowledge)拒绝接收拒绝接收 0001 0110 22 16 SYN(synchronous idle)同步空闲同步空闲 0001 0111 23 17 ETB(end of trans.block)传输块结束传输块结束 0001 1000 24 18 CAN(cancel)取消取消/作作废废ASCII编码 控制码0-31Bin Dec Hex 缩写缩写/字符字符 解释解释0001 1001 25 19 EM(end of medium)介质中断介质中断 0001 1010 26 1A SUB(substitute)替补替补 0
30、001 1011 27 1B ESC(escape)溢出溢出 0001 1100 28 1C FS(file separator)文件分割符文件分割符 0001 1101 29 1D GS(group separator)分组符分组符 0001 1110 30 1E RS(record separator)记录分离符记录分离符 0001 1111 31 1F US(unit separator)单元分隔符单元分隔符ASCII编码 控制码0-31 Bin Dec Hex 缩写缩写/字字符符 0010 0000 32 20 空格空格0010 0001 33 21 !0010 0010 34 22
31、0010 0011 35 23#0010 0100 36 24$0010 0101 37 25%0010 0110 38 26&0010 0111 39 27 0010 1000 40 28 (0010 1001 41 29 )0010 1010 42 2A *0010 1011 43 2B +0010 1100 44 2C ,0010 1101 45 2D -0010 1110 46 2E .0010 1111 47 2F /0011 0000 48 30 0 Bin Dec Hex 缩写缩写/字符字符0011 0001 49 31 10011 0010 50 32 20011 0011 5
32、1 33 30011 0100 52 34 40011 0101 53 35 50011 0110 54 36 60011 0111 55 37 70011 1000 56 38 80011 1001 57 39 90011 1010 58 3A :0011 1011 59 3B ;0011 1100 60 3C 0011 1111 63 3F?0100 0000 64 40 ASCII编码 字符码32-64Bin Dec Hex 缩写缩写/字字符符 0100 0001 65 41 A0100 0010 66 42 B0100 0011 67 43 C0100 0100 68 44 D0100
33、 0101 69 45 E0100 0110 70 46 F0100 0111 71 47 G0100 1000 72 48 H0100 1001 73 49 I0100 1010 74 4A J0100 1011 75 4B K0100 1100 76 4C L0100 1101 77 4D M0100 1110 78 4E N0100 1111 79 4F O0101 0000 80 50 PBin Dec Hex 缩写缩写/字符字符0101 0001 81 51 Q0101 0010 82 52 R0101 0011 83 53 S0101 0100 84 54 T0101 0101 8
34、5 55 U0101 0110 86 56 V0101 0111 87 57 W0101 1000 88 58 X0101 1001 89 59 Y0101 1010 90 5A Z0101 1011 91 5B 0101 1100 92 5C 0101 1101 93 5D 0101 1110 94 5E 0101 1111 95 5F _0110 0000 96 60 ASCII编码 字符码65-96Bin Dec Hex 缩写缩写/字字符符 0110 0001 97 61 a0110 0010 98 62 b0110 0011 99 63 c0110 0100 100 64 d0110
35、0101 101 65 e0110 0110 102 66 f0110 0111 103 67 g0110 1000 104 68 h0110 1001 105 69 i0110 1010 106 6A j0110 1011 107 6B k0110 1100 108 6C l0110 1101 109 6D m0110 1110 110 6E n0110 1111 111 6F o0111 0000 112 70 pBin Dec Hex 缩写缩写/字符字符0111 0001 113 71 q0111 0010 114 72 r0111 0011 115 73 s0111 0100 116
36、74 t0111 0101 117 75 u0111 0110 118 76 v0111 0111 119 77 w0111 1000 120 78 x0111 1001 121 79 y0111 1010 122 7A z0111 1011 123 7B 0111 1100 124 7C|0111 1101 125 7D 0111 1110 126 7E 0111 1111 127 7F DEL(delete)ASCII编码 字符码97-127ASCII码编码规则码编码规则nASCII码采用码采用7个二进制位编码来表示一个字符,并人为规个二进制位编码来表示一个字符,并人为规定在最高位前加定在
37、最高位前加“0”,共用,共用8位二进制位来表示一个字符,位二进制位来表示一个字符,这这8位二进制位在计算机中存储时占一个字节(位二进制位在计算机中存储时占一个字节(Byte),称),称为为1字节(字节(B)。)。n几个特殊的字符编码:几个特殊的字符编码:n数字数字0的的ASCII码二进制为码二进制为0011 0000B,十进制代码值为,十进制代码值为48D,十六进,十六进制代码值为制代码值为30H。n大写字母的大写字母的ASCII码二进制为码二进制为0100 0001B,十进制代码值为,十进制代码值为65D,十,十六进制代码值为六进制代码值为41H。n大写字母的大写字母的ASCII码二进制为码
38、二进制为0110 0001B,十进制代码值为,十进制代码值为97D,十,十六进制代码值为六进制代码值为61H。在计算机中在计算机中1个信号称为个信号称为1位,也称为了位,也称为了1bit,是最小单位,是最小单位8个信号称为个信号称为1字节,也称为字节,也称为1Byte,是基本单位,是基本单位01000001位(位(b)1个字节(个字节(B)位位:计算机存储的计算机存储的最小最小单位单位,二进制位(比特、二进制位(比特、bitbit或或b b)字节字节:计算机存储的计算机存储的基本基本单位单位,字节(字节(ByteByte或或B B)8 8位(比特)位(比特)1 1个字节、个字节、8bit 8b
39、it1Byte 1Byte、8b8b1B1BKBKB:千字节:千字节,1KB=1024B=2,1KB=1024B=21010B BMBMB:兆字节,:兆字节,1MB=1024KB=21MB=1024KB=22020B BGBGB:吉字节,:吉字节,1GB=1024MB=21GB=1024MB=23030B BTBTB:太字节,:太字节,1TB=1024GB=21TB=1024GB=24040B BPBPB:拍字节,:拍字节,1PB=1024TB=21PB=1024TB=25050B BEBEB:艾字节,:艾字节,1EB=1024TB=21EB=1024TB=26060B BZBZB:泽字节,:
40、泽字节,1ZB=1024EB=21ZB=1024EB=27070B BYBYB:佑字节,:佑字节,1YB=1024ZB=21YB=1024ZB=28080B BBBBB:剥字节,:剥字节,1BB=1024YB=21BB=1024YB=29090B B常见的计算机容量单位常见的计算机容量单位练一练、ASCII码的全称是码的全称是:,共共 个字符,编码规则为:以个字符,编码规则为:以位二进制位编位二进制位编码组成,最高为固定为码组成,最高为固定为。美国信息交换标准码美国信息交换标准码12870练一练、查表、查表1.2.3,填写下表:,填写下表:、已知大写字母、已知大写字母S的的ASCII码为:码为
41、:0101 0011,则R的编码是什么:0101 0010 0100 00016541g103670011 0110366z0111 1010122练一练、已知一篇英文稿件共有、已知一篇英文稿件共有9216个字符,请计算,个字符,请计算,该篇稿件存在计算机内的存储容量约多少该篇稿件存在计算机内的存储容量约多少KB?9216/10249KB、张普通的光盘容量为、张普通的光盘容量为630,请问它,请问它能存放多少个能存放多少个ASCII字符?字符?630*1024645 120KB645120*1024660 602 880计算机内字符的编码计算机内字符的编码n计算机内普遍使用的字符编码计算机内普
42、遍使用的字符编码:n ASCII码码(美国信息交换标准码美国信息交换标准码)n(American Standard Code for Information Interchange)。)。nASCII码基本编码数共码基本编码数共128个,刚好可用个,刚好可用7位二进制位位二进制位表示该表示该128个字符编码。个字符编码。nASCII码采用码采用7个二进制位来编码个二进制位来编码,在计算机中存储时在计算机中存储时占一个字节(占一个字节(Byte),字节的最左位用),字节的最左位用“0”填充,填充,共用共用8位二进制位表示一个字符,称为位二进制位表示一个字符,称为1字节(字节(B)。)。回顾计算机
43、存储的最小单位 二进制位(比特、bit或b)计算机存储的基本单位 字节(Byte或B)8位(比特)1个字节、8bit1Byte、8b1B01000001位(位(b)1个字节(个字节(B)计算机内的容量单位计算机内的容量单位回顾存储容量(文件大小)单位B、KB、MB、GB、TB1KB=1024B KB(千字节)1MB=1024KBMB(兆字节)1GB=1024MBGB(千兆字节)1TB=1024GB TB(百万兆字节)依次增大,每一级增大1024倍1.2.3 汉字编码汉字编码汉字为图形字符。汉字为图形字符。汉字分汉字分常用字,次常用字,中文符号,非常用常用字,次常用字,中文符号,非常用字等字等,
44、数量达一万多个。音、形、义各不相同,数量达一万多个。音、形、义各不相同,如何让计算机可以处理众多的汉字?如何让计算机可以处理众多的汉字?汉字编码方案汉字编码方案v上述问题的解决是通过上述问题的解决是通过汉字编码汉字编码方案来实现的。方案来实现的。计算机处理汉字信息有以下几个问题需要解决:1.怎样将汉字输入计算机?2.在计算机内部怎样处理汉字?3.在各计算机系统之间怎样交换汉字信息?4.计算机怎样实现汉字信息的输出(字形显示)?汉字汉字与西文字符一样,也是一种字符,在计算机内同样是以二进制代码形式表示的。计算机处理汉字原理计算机系统计算机系统B交换码交换码输入码输入码(外码)(外码)译码译码处理
45、码处理码(内码)(内码)字形码字形码汉字显示汉字显示OS的汉字服务程序的汉字服务程序计算机系统计算机系统A输入输入输出输出处理处理传输传输汉字编码汉字编码 汉字与西文字符一样,也是一种字符,为了让计算机能处理和识别汉字,在计算机内也是以二进制代码形式表示的,这些代码,称为汉字编码。1、国标码、国标码GB 231280(1981年由国家语委编写)。年由国家语委编写)。GB2312汉字编码库中包含:符号汉字编码库中包含:符号682个;常用汉字有个;常用汉字有3755个,称一级汉字;非常用字有个,称一级汉字;非常用字有3008个,称二级汉字,个,称二级汉字,一一级汉字以拼音顺序编排,二级汉字以部首顺
46、序编排级汉字以拼音顺序编排,二级汉字以部首顺序编排。编码方式:由一个编码方式:由一个94行行94列的大表格表示,每一行有列的大表格表示,每一行有94个汉字(字符),为一组,也叫一区,共个汉字(字符),为一组,也叫一区,共94区。区。范围:范围:01019494其中:其中:01-09:符号区,包含:符号区,包含682个符号个符号 B0-F7:汉字区,包含:汉字区,包含6763个汉字,个汉字,汉字编码GB231280如:饼如:饼(1793区位码区位码)区号:区号:17 位号:位号:93,为了处理与存储的方便,每个汉字的区号和位号在为了处理与存储的方便,每个汉字的区号和位号在计算机内部分别用计算机内
47、部分别用一个字节一个字节来表示,共来表示,共二个二个字节。字节。汉字编码汉字编码 汉字输入码是解决如何利用西文标准键盘来快捷地输入汉字的编码,常用的有拼音输入法、五笔输入法等。汉字输入码使用字母、数字和符号来对汉字进行编码。2、输入码(外码)、输入码(外码)汉字编码汉字编码汉字的输入汉字的输入n向计算机输入汉字的两种方法向计算机输入汉字的两种方法:(1)自动识别方式自动识别方式(字形字形/语音语音)(2)将汉字编码将汉字编码(外码外码)输入输入n音码:如全拼码、双拼码、简拼码等。音码:如全拼码、双拼码、简拼码等。n形码:如五笔、郑码等。形码:如五笔、郑码等。n音形码:智能音形码:智能ABCn形
48、音码:形音码:米字形音码左手中文输入法米字形音码左手中文输入法 3、机内码(处理码)、机内码(处理码)n处理码:计算机内部用于信息处理的汉字代码,也称汉字机内码。是汉字的存储码。是汉字的存储码。输入码与机内码n同一个汉字有多种输入码,它的机内码却是唯一的。一个汉字用一个汉字用2个字节(个字节(16个二进制位)来表示。个二进制位)来表示。如:饼如:饼(1793)区号:区号:17 位号:位号:93,17D0001,0001B 93D0101,1101B汉字编码机内码编码规则若按这样的编码,汉字就和ASCII码混淆了,所以机内码的编码规则是把相应字节最高位的“0”改为“1”则上述的“饼”字的机内码为
49、:1001,0001B 1101,1101对应的16进制为:9 1 D D思考:如下编码是字符还是汉字:1、00110110 00110000 2、11000111 110101113、11011011 11011011 4、00110101 01001100内码观察n使用UtraEdit察看编码(请注意比较二进制,十进制,16进制)4.字形码字形码n汉字的字形即显示在屏幕和打印在纸上的汉字的形状,常用的字形有宋体,楷体,黑体,隶书等宋体,楷体,黑体,隶书等。4.字形码字形码汉字字形通常表示方式:点阵方式点阵方式,矢量方式矢量方式,曲线方式曲线方式点阵字体点阵字体特点:放大失真,特点:放大失真
50、,容量大容量大汉 字矢量字体矢量字体特点:不失真,特点:不失真,容量小容量小曲线字体曲线字体特点:不失真,容特点:不失真,容量更小,造字灵活量更小,造字灵活在该点阵中,有笔划的方格代码在该点阵中,有笔划的方格代码1,空方格代码为,空方格代码为0,如图点阵规,如图点阵规模为模为16X16,共,共256位二进制位,计位二进制位,计256/832字节字节汉字字形编码方式汉字字形编码方式练习练习n汉字编码根据功能的不同,可以分为:汉字编码根据功能的不同,可以分为:,等等GB231280把汉字分为二级,一级为常用字,共把汉字分为二级,一级为常用字,共3755个汉字以个汉字以顺序编排,二级次常用字共顺序编