1、课程基本信息 课题数据编码字符编码 教科书 书名:信息技术必修 1:数据与计算 出版社:人民教育出版社、中国地图出版社出版日期: 2019 年 6 月 教学目标 教学目标:1.知道字符编码作用,了解常见字符编码方案 ASCII、GB2312-1980、GBK、 GB18030-2005、unicode 字符集及编码方案。【信息意识】【计算思维】 2.了解计算机处理字符的过程, 知道中文汉字的输入码、 机内码以及输出码。 【信息意识】【计算思维】 3.掌握常见字符处理问题(txt 文档与网页乱码现象、Word 中文字重叠)的 解决方法,能够根据需要选择合适的字符编码。【信息意识】【数字化学习 与
2、创造】 教学重点:常见的字符编码方案 教学难点:常见字符处理问题的解决方法 教学过程 时 间 教学 环节 主要师生活动 2 分 钟 提 出提 出 真 实真 实 问问 题 、题 、 确 立确 立 在日常使用计算机的时候,同学们有没有遇到过这样的情 况或问题呢: 打开文本文档、浏览网页时出现了乱码现象 探 究探 究 主题主题 Word 文件中出现了文字重叠的情况 遇到这些情况时,我们该怎么办呢?若想解决问题,必要知其 原理。今天,我们就和大家一起来探究计算机是如何处理字符的。 15 分 钟 辨析辨析 概念概念 原原 理、理、 理解理解 字符字符 编码编码 计算机作为数据处理的一种工具,只识别 0
3、和 1 的二进制。因 此, 在处理各种对象时需要将其转换成计算机可识别的二进制数据。 那么字符是如何转变成二进制的呢? ( (一一) ) 探究一:字符如何变成二进制?探究一:字符如何变成二进制? 1. 字符编码的概念 字符编码是按照预先确定的规则, 将所需字符转换映射为计算机 可以接受的二进制数字的过程。字符编码方案会为每个字符指定对 应的数字编码,便于不同计算机系统间交换文件,产生的编码叫做 交换码。 字符编码包括字符集(系统支持的所有抽象字符的集合)与字 符编码(方案)(符号集合与数字系统间建立对应关系的法则)。 (1) 英文字符编码方案ASCII 在早期应用时, 计算机只用处理英文字母、
4、 数字和常用的英文标 点符号。为了处理英文字符,美国信息标准协会制定 ASCII (American Standard Code for Information Interchange)美国信 息交换标准代码。在 ASCII 编码方案中,制定了包含 128 个英文字 符的字符集,包括英文大小写字、数字、常用符号等。 提问思考:至少需要几个字节可以表示 128 个字符呢? 1 个字节为 8 位,可以表示 256 种情况。因此,ASCII 采用 1 个字节对 128 个字符进行编码。 体验活动:利用编码输入字符 在输入英文字符时,我们可以通过键入字符、插入符号等方式, 也可以利用 ALT+ASCI
5、I 编码来输入。 (2) 中文字符编码方案 当计算机引入中国后,我国的中文汉字多达 10 万多个,1 个字 节的 ASCII 编码已无法满足需求。 因此, 我国设计了 GB 系列字符编 码用于将汉字转换为计算机可接受的数字。 GB2312-1980 1980 年,我国颁布了 GB2312-1980,即信息交换用汉字编码 字符集基本集。共收录了 6763 个汉字,以及包括数字、拉丁 字母、希腊字母等在内的 682 个字符。GB2312-1980 兼容 ASCII 编 码,依然用单字节表示 ASCII 规定的英文字符,采用 2 个字节表示 1 个汉字以及其他字符。 GBK GB2312 基本满足了
6、计算机处理汉字的需要,但未包含人名、古 汉语等方面出现的罕用字。 在 GB2312 的基础上我们又增加了 2 万多 个字符 1995 年,形成了 GBK汉字内码扩展规范,。 GB18030-2005 在 GBK 的基础上,GB18030-2005 又增加了少数民族的文字。采 用单字节、 双字节和4字节的变长编码, 且能够向下兼容GBK、 GB2312 和 ASCII。 (3) unicode 字符集与编码方案 每个国家拥有自己的语言和文化,在使用计算机时也会建立自 己的字符编码。随着互联网将世界连接起来,各个国家采用的字符 编码不同,信息交流时就会产生问题。那么有没有一种编码方案能 够容纳世界
7、上的所有字符,实现集大成者呢? 面对这样的情况,国际标准化组织和 Unicode 组织制定了 unicode 字符集,致力于将世界上所有文字和符号都纳入,以满足 使用不同语言的人利用计算机进行信息交流。 对于 unicode 字符集, 常见的编码方案有 UTF-8、UTF-16、UTF-32 等。 (4) 体验活动:txt 中的联通 刚刚我们学习了常见的字符编码,下面我们通过实践体验一下 不同的字符编码对字符处理会产生什么样的影响。 体验实践 请同学们在自己的计算机中新建一个 txt 文档,输入“联通” 两个汉字,保存后再打开看看会出现什么? 原理分析 经过实践,同学们发现“联通”两个字变成了
8、乱码,那么这是 为什么呢?让我们通过一段短片来看一下。 问题解决 文本文档【另存为】-【编码】选项中选择合适的字符编码。 ( (二二) ) 探究二:计算机处理字符时要经历哪些过程?探究二:计算机处理字符时要经历哪些过程? 1. 计算机处理字符的基本工作过程 通过键盘等方式输入字符, 在计算机内部进行存储和处理, 最后 通过显示屏等输出。 (1) 输入字符 英文字符:利用键盘直接键入 中文汉字:输入码(外码) 输入码是将汉字与键盘能建立对应关系,实现利用键盘将汉字 输入到计算机中。 (2) 处理字符 英文字符:ASCII 编码 中文汉字:机内码(由交换码计算而来) 由于 GB2312-1980
9、等编码方案兼容 ASCII 编码,以 3021(十六 进制)为例,它在 GB2312-1980 和 ASCII 中表示不同,计算机就会 产生歧义。因此,计算机在处理中文汉字时,要在交换码的基础上 计算得出机内码。 (3) 输出字符 字型码用于字符在显示屏或打印机输出, 又称输出码、 字模码, 通常有两种表示方式:点阵和矢量。不同的字体库拥有不同的字形 码。 2. 小结计算机处理字符的过程 环节环节英文英文中文中文 输入键盘直接键入 输入码 (拼音、五笔等) 处理ASCII 编码机内码 输出字型码(输出码):点阵&矢量 6 分 钟 解决解决 常见常见 问问 题、题、 应用应用 所学所学 实践实践
10、 1. 问题 1:如何解决乱码的问题? 解决方法:选择合适的字符编码方案 (1) txt 文档另存为选择编码方案 (2) 网页右击选择编码方案 2. 问题 2:如何解决 Word 中的文字重叠? 解决方法:字间距设置,选择合适的字体库 3. 问题 2 拓展:Word 能不能同时保存字体? 解决方法:保存时嵌入字体库 学生根据演示视频学习保存 Word 文件时嵌入字体库的方法并实 践。 2 分 钟 回 顾回 顾 复 习复 习 新新 知 、知 、 自 评自 评 学 习学 习 效果效果 1. 回复复习所学知识 2. 利用小测自评学习效果 Q1. 在 GB2312-1980 中, 一个汉字占用几个字节? (单选) () A.1 个B.2 个C.4 个 Q2. 以下哪些是常用汉字的编码方案?(多选)() A.ASCIIB.GB2312-1980C.GBKD.GB18030-2005 Q3.用计算机处理汉字, 可能要经历哪些编码过程? (单选) () A.输入码-ASCII 码-字型码 B.字型码-机内码-输入码 C.输入码-机内码-字型码 E.unicode 字符集与 UTF-8 编码