1、 信息技术 必修一 1.1 感知数据contents1.2 数据、信息与知识1.3 数据采集与编码1.4 数据管理与安全1.5 数据与大数据PART能描述生活中常见的数据认识数据对人们生活的影响当今社会,数据体现出了前所未有的价值。数据里面蕴含着巨大财富。数据也改变着人们的生活、学习、工作方式。数据的种类与形式也发生变化数据及其演变造纸术和印刷术人 们 对 数 据 的 利 用 依 赖 于载 体,造 纸 术 和 印 刷 术 的发 明,使 数 据 的 记 录 与 传输 变 得 便 捷 高 效文字与数字的出现文 字 和 数 字 的 出 现,数 据 以更 加 明 确 的 形 式 被 记 录 下 来,如
2、:泥 板、甲 骨 文 等现代技 术 发 展 提 供 了 更 多 作 为 数 据 的载 体,如:光 盘、磁 带、半 导 体等。数 据 形 式 也 多 样 化,如:文本、图 像、音 频 等。随 着 发 展,数 据 量 也 不 断 增 多,计 算 机 也 成为 了 数 据 处 理 的 主 要 工 具,大 数据 进 入 了 人 们 的 生 活。远古时期有 了 数 据 的 概 念。用 石 器 或 骨 器 在 墙上 刻 画 图 案。后 来发 明 了 结 绳 记 事 法,“事 大,大 结 其 绳,事 小,小 结 其 绳”数据与科学自古以来,人们通过观察实践,获得了大量数据,不仅在生产生活中有作用,还为早期科
3、学成果取得打下了基础,如:农历、24节气等。科学研究离不开数据。各国都在重视高精尖实验室的建设,都是为了获得某些实验数据,支持科学研究。数据与生活生活中,人们每天都在使用数据,如:超市小票、火车票、购物清单等。互联网时代,数据形式也发生变化,云计算、物联网、大数据等技术融入生活,多样的数据形式改变了人们的生活习惯。移动网络升级,扩展了手机应用领域,智能手机给人们生活带来极大便利。为了数据的直观体现,不同领域使用不同的形式来展示数据。人在使用数据的同时也在产生数据。互联网加速了数据的传递,是传统行业深度融合,发展出新经济形态:互联网+。PART能辨别数据与信息,描述数据与信息的特征理解数据、信息
4、与知识的相互关系数据数据是对客观事物的符号表示。如:图形符号、数字、字母等。单纯的数据是没有意义的。经过解释后,数据才变得有意义,数据和它的解释是密不可分的。计算机科学中,数据是指所有能输入到计算机并被计算机程序处理的符号总称,用于输入到计算机中进行处理,具有一定意义的数字、字母、符号和模拟量等的统称。信息信息自古就有。定义:通信的数学理论(香农)信息是用来消除随机不确定性的东西。信息信息的特征:载体依附性:信息是不能独立存在的,必须依附于一定的载体。信息依附于载体,也体现了信息的可存储性与传递性。如:焚书坑儒导致大量信息丢失。时效性:信息往往反映的是事物某一特定时间内的状态,会随着时间推移而
5、变化。如:车票、天气预报。共享性:信息是可以共享的,同一种信息可以同时被不同的接受者获取,人们也可以重复利用信息。信息不会因为人获取而发生损耗。如:广播、直播。可加工处理、真伪性:信息是可以加工处理的。信息经过加工处理能更好的被人使用。如:柱状图、空城计。价值性:包括显性价值和隐性价值,显性价值指信息内容本身具有的价值,一般可被人直接了解。如:看天气预报判断是否加衣。隐性价值是除了信息内容外的价值,包括与信息紧密相关的所有价值。如:通过检测气温,得到温室效应情况。信息的价值具有相对性。知识知识是人类在社会实践中所获得的认识和经验的总和,也是人类在实践中认识客观世界(包括人类自身)的成果,包括对
6、事实、信息的描述以及在教育和实践中获得的技能。知识是可以继承和传递的。如:“站在巨人的肩膀上”,课本里的只是都是以前总结积累并继承下来的。数据、信息与知识三者的关系数据信息知识智慧储 存、分 析 及 解 释加 工、归 纳综 合 能 力,收 集、加 工、应 用PART感受数字化在生活学习中的作用知道编码的基本方式掌握常见进制之间的转换掌握声音、图像编码计算从前车马很慢,书信很远,一生只够爱一个人,现在高铁很快,视频很近,一天可以看很多人!反映了什么问题?计算机技术的应用,使得数据的处理方式发生了巨大的转变,数据的处理效率也得到了极大的提高。数据采集早期:数据的采集使用观察、实验等人工方式得到并记
7、录。例如:填写实验报告单等。现在:互联网、物联网的发展使得数据获取方式变多、获取速度变快。如:网络爬虫,传感器应用等。拓展传感器:是一种能感受被测量并按照一定的规律转换成可用输出信号的器件或装置。传感器可以持续不断的采集数据。其应用广泛,各行各业均有使用。数制数的进制数据在计算机内部是以二进制方式进行存储和处理的。进制是一种记数方式,也称进位计数法或者位值记数法。利用这种记数法,可以使用有限种数字符号来表示所有的数值。任何一种数制都包含两个基本要素:基和权。基又叫基数,是组成该数制的数码个数,如:十进制的基数就是十。权又叫权值,是指每一个数位上的1对应的数值,可以表示为基数的若干次幂。最高位的
8、权值是Kn-1例如:十进制数 234百位十位个位234102101100基数:10权值:表示:234=2x102+3x101+4x100200 30 4 常见进制及转换方式在信息技术中,人们通常采用二进制、八进制、十进制、十六进制来表示信息。为了区分各种进位制的数码,通常用一个下标来表示(十进制省略),也可以在数的后面用字母来表示。进位制进位制二进制二进制八进制八进制十进制十进制十六进制十六进制字母标识BODH下标(2)(8)(10)(16)示例10110B或10110(2)26O或26(8)2216H或16(16)生活中有哪些常见的进制?七进制、十二进制、二十四进制、六十进制常见进制及转换方
9、式特点:有两个基本数码:0,1。采用逢二进一的进位规则。二进制例如:10110B+1=10111B10111B+1=11111B+1=11000B100000B常见进制及转换方式特点:有八个基本数码:0,1,2,3,4,5,6,7。采用逢八进一的进位规则。八进制例如:26O+1=27O27O+1=27O+7=30O36O常见进制及转换方式特点:有十六个基本数码:0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F。采用逢十六进一的进位规则。十六进制例如:16H+1=17H17H+8=17H+D=1FH24H10 11 12 13 14 15常见进制及转换方式二进制、八进制、十进制、十
10、六进制之间对应表十进制十进制二进制二进制八进制八进制十六进制十六进制十进制十进制二进制二进制八进制八进制十六进制十六进制0000810001081111910011192102210101012A3113311101113B41004412110014C51015513110115D61106614111016E71117715111117F常见进制及转换方式十进制转二进制十进制转n进制短除法23(10)=10111 (2)2 23 2 11 1 2 5 1 2 2 1 2 1 0 0 1 余数读数十进制转八进制十进制转十六进制23(10)=27 (8)23(10)=17 (16)8 23 8
11、 2 7 0 2余数16 23 16 1 7 0 1余数 一定要除到商为0才算结束!每算一步,余数都往后写上!读数从下往上倒着读!常见进制及转换方式二进制转十进制n进制转十进制按权相加法10011(2)=19 (10)124+023+022+121+120八进制转十进制271(8)=185 (10)十六进制转十进制1C5(16)=453 (10)282+781+180=264+78+11=1851162+12161+5160=256+192+5=453常见进制及转换方式二进制转十进制8421法 8421法是按权相加法的简化过程 仅适用于二进制的转换,二进制转八进制、十进制、十六进制10011(
12、2)=124+023+022+121+120=19 (10)24 23 22 21 201 0 0 1 116 0 0 2 1+权值练一练11010011(2)=211 (10)1 1 0 1 0 0 1 1128 64 32 16 8 4 2 116 8 4 2 1常见进制及转换方式二进制转八进制8421法 8421法是按权相加法的简化过程 仅适用于二进制的转换,二进制转八进制、十进制、十六进制10011(2)=23 (8)0 1 0 0 1 1前提因素:23=8,即:三位二进制可以表示0-7,刚好是八进制的基本数码4 2 1 4 2 12 3先从右往左分组,每三位二进制为一组,分到最后一组
13、时,不足三位二进制的,往前补0。练一练11010011(2)=323 (8)0 1 1 0 1 0 0 1 14 2 1 4 2 1 4 2 13 2 3常见进制及转换方式二进制转八进制8421法 8421法是按权相加法的简化过程 仅适用于二进制的转换,二进制转八进制、十进制、十六进制10011(2)=13 (16)0 0 0 1 0 0 1 1前提因素:24=16,即:四位二进制可以表示0-F,刚好是十六进制的基本数码8 4 2 1 8 4 2 11 3先从右往左分组,每四位二进制为一组,分到最后一组时,不足四位二进制的,往前补0。练一练11010011(2)=D3 (16)1 1 0 1
14、0 0 1 18 4 2 1 8 4 2 113 3数字化信息可以用模拟信号或数字信号表达。模拟信号是以连续变化的物理量存在,如:温度值,电流值,声波等。数字信号在取值上是离散的、不连续的信号,这种信号表示的数据是指可被计算机存储、处理的二进制数据。模拟信号与数字信号可以相互转换。模数转换(ADC)、数模转换(DAC)数字化信息可以用模拟信号或数字信号表达。模拟信号是以连续变化的物理量存在,如:温度值,电流值,声波等。数字信号在取值上是离散的、不连续的信号,这种信号表示的数据是指可被计算机存储、处理的二进制数据。模拟信号与数字信号可以相互转换。模数转换(ADC)、数模转换(DAC)为何要把模拟
15、信号转数字信号?因为计算机内部只能处理数字信号。数字化从模拟信号到数字信号需要经过:采样量化编码,(即数字化的过程)数字化采样将信号从连续时间(空间)域上的模拟信号转换到离散时间(空间)域上的离散信号的过程。对于同一模拟信号,采样时间间隔约小,采集到的信号样本数量越多。每秒的采样样本数叫做采样频率(Hz)。相同时间内,采样频率越高,采集的样本数量越多。将模拟信号转换成数字信号,会引起失真,影响信号保真度的一个因素是采样频率,提高采样频率能提高保真度。如:在线听音乐。对于基于时间域的模拟信号,采样其实就是按一定的时间间隔取值。数字化量化量化指将信号的连续取值近似为有限个离散值的过程。连续信号经过
16、采样成为离散信号,离散信号经过量化后可用数值表示。量化的过程是先将整个幅度划分成有限个小幅度的集合,把落入某个范围内的样值归为一类,并赋予相同的量化值。数字化编码编码是信息按照某种规则或格式,从一种形式转换为另一种形式的过程,解码是编码的逆过程。存储容量单位计算机中存储容量最小单位是比特(bit)也称为位,1位二进制数码表示1个bit,但由于1bit所能表示的值太小,实际上计算机中都以8bit为一个基本单位,称为字节(Byte)。常见的单位还有KB,MB等,转换关系如下:1B=8bit1KB=1024B 1MB=1024KB1GB=1024MB1TB=1024GB1PB=1024TB1EB=1
17、024PB1ZB=1024EB编码字符编码常见的有ASCII、Unicode以及各种汉字编码。十进制数字符 48 0 65 A 97 a编码字符编码常见的有ASCII、Unicode以及各种汉字编码。汉字编码:计算机中汉字也采用二进制进行编码的。汉字编码分为外码、交换码、机内码和字形码。外码也叫输入码,是用来将汉字输入到计算机中的一组键盘符号,常用的有拼音、五笔。机内码是计算机内部汉字的编码。1 1 汉字输入码(外码)汉字输入码(外码)汉字输入汉字存储汉字显示汉字打印汉字传输123342 2 处理码(内码)处理码(内码)3 3 字形码字形码4 4 区位码区位码(交换码交换码)编码字符编码常见的
18、有ASCII、Unicode以及各种汉字编码。汉字编码:计算机中汉字也采用二进制进行编码的。汉字编码分为外码、交换码、机内码和字形码。外码也叫输入码,是用来将汉字输入到计算机中的一组键盘符号,常用的有拼音、五笔。机内码是计算机内部汉字的编码。在计算机内部,汉字占用2字节,英文字母占用1字节。编码声音编码将模拟声音数字化需要讲过采样、量化、编码三过程。在音频数字化的过程中,声音保真度受采样频率和量化值的影响,采样频率越高,量化位数越多,声音越保真,其存储容量也越大。常见的格式有Wave、MP3、WMA等。采样、量化 模拟信号(连续)数字信号(0、1)采样频率:每秒所采样的次数,单位为HZ(赫兹)
19、。量化位数:每个采样点所需的二进制位数。存储容量=采样频率(Hz)量化位数(bit)声道数 时长(s)(单位:位/bit)编码图像编码数字图像包括矢量图形和位图图像。矢量图形是指用点、直线或多边形等基于数学方程的几何图元表示的图像,放大不失真。位图图像又称为栅格图或点阵图,组成它的基本单位是像素。像素点越多,图像越真实,放大会失真。常见位图格式:jpg、jpeg、gif、bmp、png等3203203232存储容量=总像素(像素长x宽)颜色位深度(单位:位/bit)编码图像编码色彩模式黑白只有黑和白两种颜色(1位)灰度黑到白之间256级亮度(8位)RGB以红绿蓝为三原色构成其它颜色由十进制02
20、55表示RGB(0,0,0)黑色RGB(255,255,255)白色RGB(255,0,0)红色RGB(0,255,0)绿色RGB(0,0,255)蓝色位图格式色彩模式单通道色彩位数(8*324位)位图的色彩模式编码视频编码静态的图像连续播放就形成了视频。模拟电视中,PAL制式每秒播放25帧图像,NTSC制式每秒播放30帧图像。现在数字电视采用数字传输和存储技术,具有高清晰度、双向交互、多功能多业务等优势。常见的视频文件格式:3GP、MP4、flv、avi、mov等。存储容量=总像素(像素长x宽)颜色位深度 时长(s)帧率(单位:位/bit)PART了解数据管理的基本方法理解对数据进行保护的意
21、义数据管理数据管理是利用计算机硬件和软件技术对数据进行有效收集、存储、处理和应用的过程,目的是充分、有效地发挥数据的作用。计算机数据的管理经过了:人工管理文件管理数据库管理。计算机中,数据一般以文件的形式存储。编码规则不同,文件格式也不同,如:.doc、.jpg、.mp4,用来区分不同类型的存储数据。计算机一般采用树形目录结构来管理文件。数据安全当前信息化的快速发展,大到国家,小到个人,都跟数据相关,数据安全问题也变得越来越重要。威胁数据安全的因素有很多,常见的有:硬盘损坏、操作失误、黑客入侵、计算机病毒、自然灾害等。数据存储在特定的介质上,保护数据安全也需要保护存储数据的介质,常见的保证数据
22、安全的主动手段有:硬盘阵列、数据备份、异地容灾等。除了保护存储介质外,还要提高数据本身的安全,如通过数据加密、数据校验等提高数据保密性和完整性。数据加密:通过加密算法和加密密钥将明文转变为密文,解密则是通过解密算法和解密密钥将密文恢复成明文。数据校验:为保证数据完整性进行的一种验证操作。如:MD5、CRC、SHA-1等。数据安全目的:每个人都应该提高数据安全意识,增强法律意识,采取必要的安全防范措施,及时备份重要数据,这样才能保障个人数据和财产的安全。生活中应如何保障个人数据安全?不轻信谣言,如:中奖等;不随意连接公共场合的免费WiFi;不随意使用破解软件;不访问不正规网站和下载内容;不打开不
23、知名邮件及其附件;不随意扫描二维码;不向陌生人透露个人电话,身份证等信息;手机设置锁屏密码;开启查找手机功能;电话卡丢失及时锁卡并补办;设置复杂密码,且不能有规律PART了解大数据的概念掌握大数据的特征养成大数据思维大数据的概念继移动互联网、云计算之后,大数据正在引发数信息科技产业新的变革,并开始对社会组织结构、国家治理模式、企业决策架构以及个人生活方式产生深刻的影响。定义:大数据代表着信息量大、速度快、种类繁多的信息资产,需要看特定的技术和分析方法将其转换为价值。大数据的大不仅指规模、速度和种类的特征,还意味着它超出以往常用的数据采集、组织、管理和加工等软件的处理能力,要求新型集成技术从多元
24、、复杂和巨量规模的数据集里洞察规律。大数据的特征(4个V概括)Volume数量Variety多样Value价值Velocity速度 数据体量大。速度快。体现在数据产生的速度快;和数据处理的速度快。数据类型多。大数据的数据来源多。价值密度低。大数据蕴含巨大价值,但因其数量庞大,可能发挥价值的仅是其中非常小的部分,价值密度相对较低。大数据思维大数据是一场变革,改变的不仅是数据,还有人们的思维。大数据要分析的是全体数据,而不是抽样数据。对于数据不再追求精确性,而是能够接受数据的混杂性。不一定强调对事物因果关系的探求,而是更加注重它们的相关性。大数据对社会的影响大数据已渗透到各行各业,成为重要的生产因素。大数据让生活更便利。如:出门打车,购物,个性化推荐等。大数据让决策更精准。如:公交站点线路规划。大数据带来新的就业需求。如:数据分析师、数据可视化工程师等。大数据带来新的社会问题。如:个人隐私数据泄露。本章结束