1、1.1 数据及其特征 1.1 数据及其特征 互联网、大数据时代,人们可以通过计算机和移动终端,随时互联网、大数据时代,人们可以通过计算机和移动终端,随时 随地获取信息、了解社会。例如,随地获取信息、了解社会。例如,创新中国创新中国系列纪录片对收集的系列纪录片对收集的 大量数据)包括图形、图像、视频、音频、文本(文字、数字、数大量数据)包括图形、图像、视频、音频、文本(文字、数字、数 值、字符)进行存储、挖掘和分析后,以多媒体记录新闻事件,满值、字符)进行存储、挖掘和分析后,以多媒体记录新闻事件,满 足人们对信息直观化、可视化的需求。足人们对信息直观化、可视化的需求。 1.1.1 数据 数据是现
2、实世界客观事物的符号记录数据是现实世界客观事物的符号记录, ,是信息是信息 的载体的载体, ,是计算机加工的对象。是计算机加工的对象。 在日常生活中在日常生活中, ,人们常使用符号来表达客观事人们常使用符号来表达客观事 物。例如物。例如,180 cm,70kg,180 cm,70kg、36.5CC36.5CC可以分别表示人可以分别表示人 体的身高、体重、体温情况体的身高、体重、体温情况,200m600m120km/h,200m600m120km/h可可 以分别表示物体的面积、体积、速度情况。以分别表示物体的面积、体积、速度情况。 世界世界 任何客观事物在人脑中的反映任何客观事物在人脑中的反映(
3、 (意识意识) )离不开符号离不开符号 的表达和基于符号的逻辑推理。的表达和基于符号的逻辑推理。 在计算机科学中,数据是对所有输入计算机并被计算机识别、存在计算机科学中,数据是对所有输入计算机并被计算机识别、存 储和处理的符号的总郴,是联系现实世界和计算机世界的途径。储和处理的符号的总郴,是联系现实世界和计算机世界的途径。 即即 现实世界的各种符号,包括图形、图像、视频音频、文本(文字,数现实世界的各种符号,包括图形、图像、视频音频、文本(文字,数 字,数值,字符)等数值性和非数值性符号,都可以被计算机特化为字,数值,字符)等数值性和非数值性符号,都可以被计算机特化为 二进制数(如数字二进制数
4、(如数字“180”180”在计算机中表示为在计算机中表示为10110100,10110100,字符字符“cm”cm”在在 计算机中表示为计算机中表示为0110001101101101),0110001101101101),进行各种逻辑运算,处理成有意进行各种逻辑运算,处理成有意 义的数据;义的数据; 然后将计算机运算的二进制数转换成现实世界的视、听、然后将计算机运算的二进制数转换成现实世界的视、听、 触等各种感觉的信息,如图触等各种感觉的信息,如图1-41-4所示。所示。 l大数据时代,数据不仅是信息的载体,也是人们提取信息、做出决大数据时代,数据不仅是信息的载体,也是人们提取信息、做出决 策
5、的重要依据,成为人们认识和理解现实世界客观事物的重要资源策的重要依据,成为人们认识和理解现实世界客观事物的重要资源 l探究活动探究活动 l体验体验 请同学们欣赏庆祝国庆多媒体作品。图1-5是该作品的截图。 1.1.2 数据的基本特征 l 人们在探索现实世界时,用数据记录自然现象与社会的发展。人们在探索现实世界时,用数据记录自然现象与社会的发展。 寻寻 找数据的基本特征和规律,就是探察与揭示自然和社会的发展规律。找数据的基本特征和规律,就是探察与揭示自然和社会的发展规律。 在计算机科学中,数据具有如下基本特征:在计算机科学中,数据具有如下基本特征: l(1)1)二进制。二进制。 l在计算机中,数
6、据以二进制的形式存储、加工。在计算机中,数据以二进制的形式存储、加工。 l(2)2)语义性。语义性。 l语义是将数据符号解释为客观世界的事物。语义是将数据符号解释为客观世界的事物。 l(3)3)分散性。分散性。 l数据是分散的记录,分别记录不同客观事物的运动状态。数据是分散的记录,分别记录不同客观事物的运动状态。 l(4)4)多样性与感知性。多样性与感知性。 l数据记录的形式是多样的、可看的、可听的、可感知的,如图形图数据记录的形式是多样的、可看的、可听的、可感知的,如图形图 像,视频、音频、文本等。像,视频、音频、文本等。 l讨论讨论 以小组为单位,查阅并分享体现数据基本特征的例子,同时讨论数据还有哪些特征。 l项目实施项目实施 各小组根据项目选题及拟订的项目方案,结合本节所学知识,开展以下活动。 1. 完成相应作品录音、录像或扫描图像等数据的采集和分析。 2. 总结与记录数据采集和分析的方法。