1、-1-第一节感知数据第二节数据、信息与知识-2-第一节感知数据第二节数据、信息与知识课标导引知能构建课标导引教材重点课标要求学业质量水平感知数据通过具体事例感知数据来了解生活中的各种数据;结合数据的应用了解数据的演变及对社会的作用1-1数据理解数据的定义,提取数据的特征1-1信息理解信息的定义,提取信息的特征1-1知识了解知识与智慧1-1数据、信息和知识的关系能辨别数据与信息的区别;结合实例阐述数据、信息、知识和智慧之间的关系1-1-3-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建考点考点1感知数据1.数据自远古时期就有且无处不在。2.数据与生活密切相关,人类生活离不开数据。人
2、类对数据的利用在一定程度上依赖于载体(文字、图片)。技术的发展提供了更多记录数据的载体(声音、动画、视频)。大多数数据会随着时间推移而变化。人利用数据的同时,自身行为也在产生数据。互联网加速了数据的传递。3.数据是科学的基础,并为科学研究提供实证。-4-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建考点考点2数据1.数据是对客观事物的符号表示。2.计算机科学中,数据是指所有能输入到计算机并被计算机程序处理的符号总称,其表现形式可以是文字、图形、图像、音频、视频等。3.单纯的数据是没有意义的,数据和关于数据的解释密不可分。4.数据来源的不同决定了数据的多样性。-5-第一节感知数据第
3、二节数据、信息与知识课标导引知能构建知能构建典例1下列有关数据的说法正确的是()A.数据是数字化时代产生的B.数据产生后就不会发生变化C.人类的自身行为也在产生数据D.数字化时代数据的表现形式就是数字答案 C解析 A.数据是远古时期就有的;B.大多数数据会随着时间推移而变化;D.数字化时代,数据的表现形式可以是文字、图形、图像、音频、视频等。-6-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建考点考点3信息1.信息自古就有。2.香农对信息的定义:信息是用来消除随机不确定性的东西。3.信息的特征(1)载体依附性信息是不能独立存在的,必须依附于一定的载体。同一信息可以依附于不同的载体
4、获取信息的途径和方法多样化。信息依附于载体也体现了信息的可存储性与传递性。(2)时效性信息往往反映的是事物某一特定时间内的状态,它会随着时间的推移而变化。思考:过时的信息还有没有价值?-7-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建(3)共享性信息是可以共享的,同一种信息可以同时被不同的接受者获取,人们可以重复利用信息。信息不会因为共享而发生损耗。(4)可加工处理性、真伪性信息是可以加工处理的。经过加工、处理、分析后的信息可以更好地被人们所使用。在加工、处理信息的过程中,有时因为人的主观因素会产生虚假信息,使信息具有真伪性。-8-第一节感知数据第二节数据、信息与知识课标导引知
5、能构建知能构建(5)价值性信息具有价值性,信息的价值包括显性价值和隐性价值。显性价值指的是信息内容本身具有的价值,一般可被人们直接了解或体会。隐性价值指的是除信息内容外的价值,包括与信息紧密相关的所有价值。信息的价值是相对的,对于不同的人群、不同的时间,其价值可能有所不同。-9-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建典例2下列有关信息的说法正确的是()A.过时的信息不再具有价值B.同一信息只能依附于相同的载体C.在加工、处理信息的过程中,可能会产生虚假信息D.信息不会因为共享而发生损耗,其价值是恒定不变的答案 C解析 A.信息的价值往往会随着时间的流逝而衰减,但不意味着超
6、出有效期后不再具有任何价值,例如某台风过后,其相关信息的价值降低了,但是在后期对台风天气的研究中,这些数据还是具有一定的参考价值;B.同一信息可以依附于不同的载体;D.信息的价值是相对的,对于不同的人群、不同的时间,其价值可能有所不同。-10-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建考点考点4知识1.知识是人类在社会实践中所获得的认识和经验的总和,也是人类在实践中认识客观世界(包括人类自身)的成果,它包括对事实、信息的描述及在教育和实践中获得的技能。2.知识是可以继承和传递的。-11-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建考点考点5数据、信息与知识的关
7、系1.数据经过储存、分析及解释后产生的意义就是信息,数据是信息的载体,单纯的数据是没有意义的。2.通过归纳、演绎、比较等手段对信息进行挖掘,将万千信息中有价值的部分沉淀下来,与已存在的人类知识体系相结合,形成知识。智慧:是一种更高层次的综合能力,主要表现为收集、加工、应用、传播知识的能力,以及对事物发展的前瞻性看法。是在知识的基础上,通过认知的累积,从而形成对事物的认知、远见,体现为一种卓越的判断力。-12-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建3.数据、信息、知识与智慧的关系如下图-13-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建典例3“某个冬夜,小明
8、睡前发现阳台上的温度计读数为-2,他马上和家人一起把裸露在户外的水管用旧衣服包裹起来,并将阳台上的水龙头调整至滴水状态,用一个较大的桶接水。”结合上述事例,下列对于数据、信息和知识的描述错误的是()A.-2是没有意义的数字B.-2是意义为“某个冬夜小明家阳台上的温度”的信息C.小明看到温度计读数为-2,联想到冰冻,这是智慧的体现D.小明和家人一起做了防水管冰冻措施,说明他们具备相关知识答案 C解析 小明看到温度计读数为-2,联想到冰冻,这既是常识也是知识,不是智慧。-14-课时1数据采集、数字化、数制-15-第一节感知数据第二节数据、信息与知识课标导引知能构建课标导引教材重点课标要求学业质量水
9、平数据采集了解数据采集的常见方法,能通过互联网采集所需数据1-1数字化掌握模拟信号数字化的一般流程,理解采样与量化的概念3-1数制掌握二进制、十进制、十六进制之间的转换方法2-1编码理解编码的概念与具体应用,能计算声音与图像的存储容量2-1-16-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建考点考点1数据采集1.数据处理方式的转变(1)人工采集、处理:数据量较小时,用传统方式处理。(2)机器采集为主、计算机处理(转换为二进制):互联网和物联网的发展导致数据量急剧增大,需要提高数据处理效率,使得数据获取方式变多、数据获取速度加快。2.数据采集的主要方式(1)传感器:实时获取自然信
10、源的数据(2)互联网:日常所需数据的主要来源网络爬虫应用程序接口(API)-17-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建3.传感器类型:温度、湿度、声音、海拔、倾角、光敏、烟雾、距离定义:感受被测量并按照一定的规律转换成可用输出信号的器件或装置,通常由敏感元件和转换元件组成。-18-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建典例1下列有关目前数据采集的说法正确的是()A.以机器采集为主B.通过互联网实时获取自然信源的数据C.采用观察、测量、实验和调查等人工方式采集D.通过传感器采集的数据成为日常所需数据的主要来源答案 A解析 B.可通过传感器而非互联网随
11、时获取自然信源的数据;C.目前数据采集以机器为主;D.互联网成为日常所需数据的主要来源。-19-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建考点考点2数字化1.数字化定义:将模拟信号(自然界中的数字、文字、图像、声音等)转换为数字信号(计算机可以处理的二进制)的过程。重要性:信息社会的技术基础过程:采样量化编码主要设备:模数转换器(ADC)-20-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建2.采样定理定义:自然界中的各种模拟信号,通过采样定理都可以用0和1来表示。基本内容(香农):在一定条件下,用离散的序列可以完全代表一个连续函数。数字信号处理领域:将连续信号
12、(模拟信号)转换成离散信号(数字信号)的理论依据。-21-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建3.采样定义:按一定的时间间隔对模拟信号取值将信号从连续时间(空间)域上的模拟信号转换到离散时间(空间)域上的离散信号的过程,通过采样器实现。CD的采样频率:44.1kHz44100Hz采样频率:每秒钟采样的次数(每秒的采样样本数)单位:赫兹Hz(4)结论:采样频率越高,单位时间内的采样点越多数字化后的数据存储容量越大,质量越好。-22-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建4.量化定义(数字信号处理领域)将信号的连续取值近似为有限个离散值的过程。将采样到
13、的信号(模拟信号的波形)用数字表示出来。过程:将整个幅度划分成有限个小幅度集合,把落入某个范围内的样值归为一类,并赋予相同的量化值。图乙将整个幅度划分为8个小幅度(07)量化级别为8。图乙中每个采样点量化时取8个量化级别中的1个作为量化值每个采样点的值量化后需要3位二进制存储量化位数为3(原理见考点考点3-7“信息传递规则”)。要点:纵坐标划分越细,量化越精细,与实际数据越接近。辨析:量化级别&量化位数-23-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建结论:量化划分越细,每个采样点量化取值越精确且存储需要的位数越多数字化后的数据存储容量越大,质量越好。-24-第一节感知数据第
14、二节数据、信息与知识课标导引知能构建知能构建典例2下列有关数字化的说法正确的是()A.采样频率越小,数字化后的数据质量越好B.采样频率越小,存储容量越大C.量化划分越细,数字化后的数据质量越好D.量化划分越细,存储容量越小答案 C解析 采样频率越高,数字化后的数据存储容量越大,质量越好;量化划分越细,数字化后的数据存储容量越大,质量越好。-25-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建2.进制一种记数方式,亦称进位计数法或位值计数法。可以使用有限种数字符号来表示所有的数值。3.常见的数制进位制二进制八进制十进制十六进制标识BODH考点考点3数制1.数据在计算机内部都以二进制
15、方式进行存储和处理。-26-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建4.计数规则二进制:2个数码:0、1,逢二进一,借一当二。十进制:10个数码:09;逢十进一,借一当十。十六进制:16个数码:09,A,B,C,D,E,F;逢十六进一,借一当十六。5.基:组成该数制的数码个数,k进制的基数为k。6.权(权值):每一个数位上的1对应的数值。下图中,有下划线位的权值为103所以十进制数12345还可表示为1104+2103+3102+4101+5100。-27-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建7.信息传递规则概念:n个二进制比特位(bit),可以表示
16、2n个不同的信息单元。应用:用1个二进制位的0/1去模拟实际生活中有且只有两种不同稳定状态的事物。例:开关的开和关两种不同的稳定状态可以用1位二进制bit位去模拟它的状态,这个二进制位上1对应开,则0对应关。-28-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建典例3某电子设备的电路板上有一个6位“跳板开关”,此开关每一位都只有“打开”和“闭合”两种状态。这个“跳板开关”最多能表示的状态数为()A.128B.64C.60D.6答案 B解析 6位跳板开关相当于6个二进制的bit位,根据信息传递规则,最多的状态数为26=64。-29-第一节感知数据第二节数据、信息与知识课标导引知能构
17、建知能构建8.进制转换(1)十进制向n进制转换:除n取余要点余数写在被除数后面一直除到被除数为0为止余数倒着取十进制二进制:除2取余-30-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建例题:(18)10=(10010)2-31-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建典例4(29)10=()2 答案 11101 解析(29)10=(11101)2-32-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建十进制十六进制:除16取余例题:(172)10=(AC)2-33-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建典例5(181)10=
18、()16 答案 B5 解析(181)10=(B5)16-34-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建(2)n进制向十进制转换:按权相加要点从低位向高位标权,以0起始提取每位上的数(以十进制形式)该位的权值累加-35-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建二进制十进制例题:(1101)2=(13)10=123+122+021+120=8+4+1=13D-36-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建典例6(11001)2=()10 答案 25 解析=124+123+022+021+120=16+8+0+0+1=(25)10-37-第
19、一节感知数据第二节数据、信息与知识课标导引知能构建知能构建十六进制十进制例题:(A8)16=(168)10-38-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建典例7(C2A)16=()10 答案 3114 解析=12162+2161+10160=3072+32+10=(3114)10-39-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建(3)二进制和十六进制互换要点如图所示,完整表达十六进制的16个数码需要4位二进制二进制和十六进制的互换要借助“中间人”十进制-40-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建二进制十六进制要点4位二进制1位十六进
20、制:从低位往高位每4位进行断位(若断位时不足4位,则高位补0)-41-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建例题:(1001011011)2=(25B)16-42-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建典例810110101B=H 解析 答案 B5-43-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建十六进制二进制要点:每1位十六进制可以用4位二进制表示(若转换时不足4位,则高位补0)-44-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建典例9E4H=B 答案 11100100 解析 最高位的0可以省略,低位的0不可省略,
21、必须补足4位。E4H=11100100BEH=14D=1110B4H=4D=0100B-45-课时2编码(1)-46-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建考点考点1编码&解码1.编码:信息按照某种规则或格式,从一种形式转换为另一种形式的过程。2.解码:编码的逆过程。-47-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建考点考点2数据的存储容量单位1.表示信息和存储信息的单位b:比特(bit),存放1位二进制数码,0或1。表示计算机中存储容量的最小单位B:字节(Byte),存储器容量计量的最基本单位1B=8bit2.常用二进制数量级1K=210=10241=
22、1024B1M=220=10242=1024K1G=230=10243=1024M1T=240=10244=1024G1P=250=10245=1024T1E=260=10246=1024P1Z=270=10247=1024E-48-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建考点考点3字符编码1.常见编码:ASCII、Unicode及各种汉字编码2.ASCII码(美国信息交换标准代码)基于拉丁字母单字节编码系统共128个编码(33个控制字符、10个阿拉伯数字、26个英文大写字母、26个英文小写字母与一些标点符号、运算符号)十进制0127二进制0000000001111111十
23、六进制007F-49-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建名师点睛:ASCII码的十六进制范围:007F,大于7FH(从80H开始)的都不是ASCII码字符。-50-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建3.常用需要记忆的ASCII编码值 字符 十进制ASCII码十六进制ASCII码空格 322004830A65大小写字母十进制编码相差32D41大小写字母十六进制编码相差20Ha9761-51-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建4.ASCII字符推算大小规则:09AZaz往后推算是+字符之间的差值往前推算是-字符之间的差值
24、大写字母6个其他字符小写字母大写字母=小写字母-32D(或20H)小写字母=大写字母+32D(或20H)-52-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建5.汉字编码汉字和ASCII字符一样,计算机内以二进制形式存在,每个汉字存储时需要2个字节。分类外码(又称输入码):将汉字输入计算机的编码。输入码分为音码、形码、音形码、形音码交换码(国标码):方便各种数字系统(不仅是计算机系统)之间的汉字信息的通信交换,常用交换码:GB2312-80机内码(处理码):计算机内部用于信息处理的汉字代码字形码:对汉字字形的编码,用于汉字输出显示和打印。两种汉字字形表示方式:矢量方式和点阵方式。
25、点阵容量计算公式:点的个数每个点存储的位数(bit)-53-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建典例1汉字点阵码是一种用黑白两色点阵来表示汉字字形的编码。一个1616点阵字模的存储容量为()A.1BB.16BC.32BD.64B答案 C解析 计算公式:点的个数每个点存储的位数(bit)。已知黑白两色,根据信息传递规则,每个点存储需要1bit,1B=8bit,所以存储容量为16161/8=32B。-54-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建6.实验:字符内码(UltraEdit)半角状态(常态)字符存储二进制bit十六进制H1个ASCII字符1B8
26、21个汉字2B164范例:如下图所示-55-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建典例2小孙用UltraEdit软件观察“211人才网”这几个字,显示的十六进制内码如下图所示。则汉字“人”的内码是()A.31B.C8C.C8CBD.B2C5 答案 C解析 图中前3个字节对应的十六进制代码32 31 31都在00,7F范围内,所以是ASCII码字符。“人”是汉字内码占2字节,响应的十六进制内码有4位,所以其内码为C8CB。-56-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建全角状态每个字符存储2B16bit4H-57-第一节感知数据第二节数据、信息与知识课标
27、导引知能构建知能构建典例3UltraEdit软件显示的十六进制内码如下图所示。第2个“好”字的编码为()A.BAB.A3B1C.C3A3D.BAC3 答案 D解析 汉字的半角和全角输入的内码一致。所以第2个“好”字和第1个“好”字内码一致,61、31为ASCII码字符“a”和“1”的十六进制内码,“好”的十六进制内码为后面的“BA C3”。-58-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建繁体和简体的异同:形同码同、形异码异典例4UltraEdit软件显示的十六进制内码如下图所示。由图可知简体“国”和繁体“國”的内码(选填:相同/不同)。答案 不同解析 简体“国”和繁体“國”
28、字形不同,所以内码也不相同。-59-课时3编码(2)-60-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建考点考点1条形码将宽度不等的多个黑条和白条,按照一定的编码规则排列,用以表达一组信息的图形标识符。-61-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建考点考点2二维码1.用某种特定的几何图形按一定规律在平面上(二维方向)分布的黑白相间的图形记录数据符号信息。2.条形码和二维码中的信息可以由专用设备扫描获取,也可由智能手机扫描获取。3.不随意扫描非官方的二维码或安装未经验证的应用。-62-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建考点考点3容量
29、计算1.大数据量计算时,经常采用估算,估算时1024当成1000来算。2.比特率(数据速率):音频/视频1秒钟的容量;单位是kbps(k为1000,bps是bit/s)。3.-63-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建4.声音编码声音采样是从时间域上对信号进行分割,再对采样点进行量化。声音数字化过程:采样量化编码采样频率越高和量化位数越多(量化细密程度),音质越好,存储容量越大。常见格式:Wave、MP3、WMA等。-64-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建声音容量计算(1)未经压缩的(Wave)文件的存储容量计算公式:存储容量=采样频率(Hz
30、)量化位数(bit)声道数时间(s)/8(单位为B)(2)所有音频文件通用的计算公式:4存储容量=比特率(kbps)时间(s)/8(单位为KB)-65-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建典例1录制一段时长10秒的立体声WAV格式音频,采样频率为32kHz,量化位数为8bit,该音频文件的存储容量约为()A.62KBB.312.5KBC.625KB D.5000KB答案 C解析 存储容量=320008102/(81024)=625KB。-66-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建典例2时长100秒MP3格式的音频文件,其比特率为128kbps,其
31、存储容量约为MB。(结果精确到0.01)答案 1.56-67-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建5.图像编码图像:人对视觉感知的物质再现分类矢量图形:用点、直线或多边形等基于数学方程的几何图元表示位图图像(栅格图、点阵图):通过像素描述图像-68-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建难点突破:位图&矢量图辨析 位图组成:像素(亮度、颜色)修改的是像素(即像素的亮度、颜色属性)适合表现层次和色彩比较丰富的图像放大会失真存储空间大常用软件:画图、Photoshop、Fireworks常见格式:BMP、JPEG、GIF、PNG、PSD、TIFF-69
32、-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建矢量图组成:一组指令集合修改的是矢量(图元)适用于线框型、工程图、美术字拉伸放大不会失真存储空间比较小常用软件:CorelDRAW、Adobe Illustrator、AutoCAD常见格式:WMF、SVG-70-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建位图数字化采样:是从空间域上对信号进行分割,分解出来的点称为像素(像素排列越紧密,图像越清晰)量化:将每个像素的颜色量化为具体的数据。未经压缩(BMP)图像容量计算公式:图像容量=图像的像素个数存储每像素需要的位数(二进制)/8(单位为B)-71-第一节感知数据第
33、二节数据、信息与知识课标导引知能构建知能构建要点像素个数:1行的像素数1列的像素数-72-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建根据信息传递规则:n个bit可以表示2n个不同的信息单元 存储每像素需要n个bit颜色数=2n1bit黑白图像-2色-214bit16色-248bit256色-288bit256灰度级-2816位色216=65536色RGB(8bit),每种颜色8bit,存储每个像素需要24位224色结论:图像颜色种类越丰富,存储每个像素需要的位数越多-73-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建典例3像素数为1024768的65536色B
34、MP图像,其存储容量为MB。答案 1.5-74-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建6.视频编码视频:由静态图像连续播放形成。制式(帧频):播放速度PAL:25fps(帧/秒)NTSC:30fps常见格式:AVI、MPEG、MOV等。常见视频压缩模式:MPEG-1、MPEG-2、MPEG-4-75-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建容量计算未经压缩(AVI)的无声视频文件存储容量的计算公式1=1帧图像存储容量帧频播放时间(单位:B)公式2=1帧图像存储容量总帧数(单位:B)未经压缩(AVI)的有声视频文件存储容量的计算方法为:无声视频容量+音频
35、容量所有视频文件通用的存储容量计算公式:存储容量=比特率(kbps)时间(s)/8(单位:KB)-76-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建典例410分钟、800600、32位真彩色、NTSC制的视频容量约为GB。(结果精确到个位)答案 32-77-第四节数据管理与安全第五节数据与大数据-78-第一节感知数据第二节数据、信息与知识课标导引知能构建课标导引教材重点课标要求学业质量水平数据管理能选择合适的方法管理数据,理解文件的基本属性1-2数据安全了解数据保护的一般方法,提高数据安全意识4-1数据与大数据了解大数据的概念,理解大数据的特征;了解大数据对人类思维方式的影响,
36、能正确面对大数据1-3-79-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建考点考点1数据管理1.数据管理定义:利用计算机硬件和软件对数据进行有效收集、存储、处理和应用的过程,目的在于充分、有效地发挥数据的作用。2.计算机数据管理的三个阶段:人工管理文件管理数据库管理。3.Windows下的文件管理个人计算机中数据常以文件的形式存储计算机一般采用树形目录结构来管理文件,在Windows系统中,采用了更为形象的文件夹来管理文件。-80-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建【知识拓展】计算机中的文件根据编码规则,可分为多种文件格式。文本文件txt:纯文本文件,
37、可用“记事本”编辑。docx:可用Word处理的文档。wps:可用金山WPS软件处理的文档。html:可用字处理软件编辑的超文本标记语言文件(静态网页)。pdf:电子图书文档,需用Adobe Acrobat Reader软件来阅读。-81-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建图像文件bmp:Windows标准图像文件格式,即“标准位图文件”。jpg:经过有损压缩后的静态位图文件;优点是相对于bmp文件占用存储较小,缺点是图片质量较差。psd:Photoshop的专用图像格式;最大特点是可以包含多个图层。png:可移植网络图形格式;优点是支持无损压缩、压缩比高、支持透明背
38、景。gif:图形交换文件格式;优点是文件较小、支持简单动画、支持透明背景。缺点是最多只能存储256色(8位)。tif:标签图像文件格式;支持透明背景。-82-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建声音文件wav:波形文件格式,是实际声音的采样和编码,文件的容量很大,可用“录音机”工具进行声音的录制。mid:是记录midi信息的标准格式,是一个由乐器数字接口指令序列组成的计算机乐谱;容量小。mp3:当前流行的音乐文件格式,音质可与CD媲美,容量小。wma:Windows Media Player播放软件的专用格式。-83-第一节感知数据第二节数据、信息与知识课标导引知能构建
39、知能构建动画文件flc:用3DSMAX动画制作软件创建的三维动画文件格式。gif:目前网页中普遍使用的二维动画文件格式。fla:用Flash制作的二维动画源文件。swf:用Flash制作的二维动画文件格式。-84-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建视频文件avi:是一种音频、视频信号交叉存储的格式,是Windows的标准视频格式。mpg:是按MPEG标准压缩的视频文件。和avi格式相比所占空间小很多。flv:一种流媒体格式,目前在线视频网站普遍采用该视频格式。mov:苹果公司开发的影片格式。-85-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建典例1 小
40、明为制作某多媒体作品,收集了如下相关素材:背景.jpgriver.mp3head.swf中秋.html来源.mp4习俗.txt月饼.png典故.docx片头.mpg诗朗诵.wav并创建了如图所示的文件夹进行分类管理。请将下列文件归入合适的文件夹存放(填数字):答案 animation:;image:、;sound:、;text:、;video:、。-86-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建4.使用数据库管理数据的意义解决数据冗余的问题。解决维护、更新数据时需要大量的人工干预的问题。5.现代社会数据管理的主要方式:传统数据库技术基础:基于结构化数据特点:数据独立性、数据
41、可共享6.依据数据的结构化程度,可以将其分为结构化数据、非结构化数据和半结构化数据。-87-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建考点考点2数据安全1.威胁数据安全的常见因素存储介质(如硬盘)的损坏操作的失误黑客的入侵计算机病毒遭受自然灾害2.保护数据安全的方法保护存储数据的介质。对于政府部门或企业的数据,目前主要采取主动防护的手段,如磁盘阵列、数据备份、异地容灾。提高数据本身的安全:可通过数据加密、数据校验等方法提高数据的保密性和完整性。-88-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建3.数据加密:通过加密算法和加密秘钥将明文转变为密文。4.数据校验
42、:通常用一种指定的算法对原始数据计算出一个校验值,接收方按照同样的算法计算出一个校验值,如果两次计算得到的校验值相同,这说明数据是完整的。常见的数据校验方法:MD5、CRC、SHA-1。-89-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建5.信息社会数据安全关乎国计民生,保障个人数据和财产安全的要点提高数据安全意识增强法律意识采取必要的安全防范措施定期杀毒不访问危险网址不打开危险邮件、链接不随意扫描来路不明的二维码定期升级系统、安装系统补丁及时备份重要数据-90-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建典例2下列有关数据安全的说法错误的是()A.信息社会数据
43、安全关乎国计民生B.通过数据加密提高数据本身的安全C.个人数据不需要像企业数据一样备份D.操作失误是威胁数据安全的因素之一答案 C解析 个人重要数据也需要备份。-91-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建考点考点3数据与大数据1.大数据定义:大数据代表着信息量大、速度快、种类繁多的信息资产,需要特定的技术和分析方法将其转化为价值。2.大数据之“大”(1)规模、速度、种类的特征(2)超出以往常用的数据采集、组织、管理和加工等软件处理能力,要求新型集成技术从多元、复杂和巨量规模的数据集里洞察规律。-92-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建3.大数据
44、4V特征:数量(Volume)、速度(Velocity)、多样(Variety)、价值(Value)(1)数据体量大:收集和分析的数据量庞大EB、ZB,且时刻增长中(2)速度快数据产生的速度快数据处理的速度快(3)数据类型多:来源多样(人、机器)数据多种形式共存数据种类和格式不可能一致(结构化、半结构化、非结构化)(4)价值密度低:尽管大数据具有很高的价值,但与其海量的数据量相比,显得密度较低提纯-93-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建4.大数据思维大数据是一场变革,改变的不仅是数据,还有人们的思维。(1)大数据采用全样本分析,而不是抽样数据。带来更全面的认识,也能
45、更清楚地发现抽样数据无法揭示的详尽信息。(2)不再追求个别数据的精确性,允许数据混杂。数据量大到一定程度,个别数据的不准确就显得不那么重要。(3)不一定强调事物之间的因果关系,而是更注重它们之间的相关性。-94-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建5.大数据对社会的影响(1)成为重要生产因素,对经济社会发展发挥越来越重要的作用。(2)渗透到社会各层面,不断提高工作效率和生活便利性。(3)让决策更精准。(4)带来新的就业需求。(5)带来新的社会问题:信息泄露、数据安全、个人隐私、伦理道德等。-95-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建典例3下列有关
46、大数据的说法正确的是()A.大数据就是指数据很多B.大数据带来新的就业需求C.大数据采集的是非结构化数据D.大数据思维强调事物之间的因果关系答案 B解析 A.大数据不仅指数据量大,还应具有“速度快、数据类型多、价值密度低”等特点。C.大数据采集的数据类型多样,结构化、半结构化和非结构化数据都有。D.大数据思维不强调事物之间的因果关系,更注重它们之间的相关性。-96-第一节算法的概念及描述-97-第一节感知数据第二节数据、信息与知识课标导引知能构建课标导引教材重点课标要求学业质量水平算法的概念1.算法的概念、特征和要素2.能从生活和学习中发现算法,理解算法的内涵和外延2-1算法的描述1.能初步使
47、用自然语言、流程图描述简单算法2.了解算法描述的常见方式:伪代码和程序设计语言2-1-98-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建考点考点1算法的概念1.算法的定义(1)古代:主要指“算术”,即数值的计算。(2)广义:解决问题或完成任务的一系列步骤。(3)计算机科学领域:用计算机解决问题的步骤,为解决问题需要让计算机有序执行的、无歧义、有限步骤的集合。(4)计算机程序设计:用计算机能理解的语言描述算法,并将其输入到计算机中的过程。-99-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建2.算法的特征(1)有穷性:一个算法的处理步骤必须是有限的。(2)可行性:算
48、法中的每一步操作与要求都应该是算法执行者(人或机器)可以实施的,同时在现实环境中能做到并且在有限的时间内完成。(3)确定性:算法中对每个步骤的执行描述必须是明确的。(4)0个或多个输入。执行算法时,一般需从外部获取可变的数据(1个或多个);问题求解的所有数据是不变且已知的,则所需数据包含在算法中,不必输入(0个)。(5)1个或多个输出:算法需要输出问题解决的结果,否则就是无意义的算法,所以至少需要1个输出。-100-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建典例1下列关于算法的描述 的是()A.0个或多个输出B.一个算法的处理步骤必须是有限的C.算法中对每个步骤的执行描述必须
49、是明确的D.算法中的每一步操作与要求需在有限的时间内完成答案 A解析 输出至少要有1个。-101-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建3.算法的要素用计算机解决问题的本质是“数据运算”;各种运算的顺序不同(顺序、分支、循环),需要借助控制转移来调控运算顺序。算法的要素:数据、运算、控制转移。数据(范例:海伦公式计算三角形面积)初始数据(明确参与运算):三角形三边长a、b、c中间数据(运算时产生):半周长p结果数据(代表问题解决):三角形面积S-102-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建运算:对数据进行运算时,必须明确每一步的运算是什么、对哪些数
50、据进行运算等。控制转移:算法执行过程中,有时需要根据数据或运算结果的特点进行不同的处理,这时就需要运用控制转移来执行不同的操作。-103-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建典例2算法三要素分别为数据、和控制转移。答案 运算-104-第一节感知数据第二节数据、信息与知识课标导引知能构建知能构建考点考点2算法的描述算法的描述:用能被算法执行者理解的形式呈现算法。1.用自然语言描述算法(1)自然语言定义:人们在日常生活中交流使用的语言。(2)优点:通俗易懂(3)缺点冗长,且容易出现歧义计算机无法直接执行需要语义解释和格式转换。-105-第一节感知数据第二节数据、信息与知识课