1、第l单元 初识数据与计算1.1我们身边的数据1、数据在我们身边存在着各种数据,如刷公交卡时刷卡机显示的本次扣款金额和卡内余额、电子手表上显示的日期和时间、教科书封底下端的国际标准书号(ISBN)、体育课上测量的各项运动成绩等。这些数字都是数据。我们的名字、诗人创作的诗句、奥运会的主题曲、记载学校运动会的视频等都不是数字,那么它们是数据吗?实际上,数据的表现形式多种多样,除了数字以外,还有文字、图形、图像、声音和视频等形式。在日常生活中,有些数据是固定不变的。例如,不管圆有多大,它的周长与直径的比值总是一个固定的数,也就是我们常说的圆周率;再如,一个标准大气压下,冰水混合物的温度为0C。有些数据
2、是不断变化的,例如家庭每天的用电量、国际黄金价格、气温等。这些数据随着时间而改变,因此在运用此类数据时要注意时效性,否则有可能造成计算无效。有些数据是随机出现的。比如抛硬币,是正面向上还是反面向上是随机的。但若抛几百次、几千次,正面向上的可能性就稳定在50%左右。这时,数据的出现往往又有-定的概率。2、信息单纯的数据不能表达具体的含义,例如我们并不清楚像28和90%这样的数值在生活中的具体意义。在对数据进行处理或赋予其具体的情境后,这些数据就成了有意义的信息。28 和90%可以分别用于表达今日的最高气温28C,相对湿度90%,此时数据就成了有意义的信息。数据是信息的符号表示;信息是数据的内涵,
3、是对数据的语义解释。数据处理就是把原始数据转换成人们所需要的信息的过程。完整的数据处理过程一般包括数据的采集、加工、传输、存储、检索和输出六个环节。数据处理的目的是把数据转化成有用的信息以满足用户的需求。一般而言,不管是什么样的信息,它们通常都具有-些特征,如载体依附性、价值性、时效性、共享性等。以天气预报信息为例,该信息不能独立存在,需要依附于一定的载体,它可以显示在网页上,也可以显示在报纸上,体现了信息的载体依附性;人们可以利用天气预报作为穿衣或出行的参考,体现了信息的价值性;天气预报只是预报了未来某一特定时段的天气状况,它 会随着时间的推移而变化,体现了信息的时效性;作为一种资源,天气预
4、报往往可以被多个信息接收者接收并且多次使用,这就体现了信息的共享性。3、知识.知识是信息经过加工提炼后形成的抽象产物。它表述的是事物运动的状态和状态变化的规律。可以说,知识是一类高级的、抽象的,而且具有普遍适应性的信息。知识是人类求知活动的结晶。例如,人们发现感冒的发生除了与病毒感染有关外,天气条件也是一个重要因素。冷空气的人侵,造成大幅度降温,或者冷空气经过后出现冷高压天气,特别是大气压高于1030百帕的晴好天气,就会有大批人感冒。感冒指数的计算方法,是经专家调查研究和演算归纳出来的。知识是认识世界的结果,同时也是改造世界的依据。数据、信息和知识可以看作人类对客观事物感知的三个不同阶段。数据
5、是对事物属性的客观记录,信息是经过组织的有结构的数据,知识是经过人的思维整理过的信息、数据、形象、价值标准以及社会的其他符号化产物。4、数据的来源按照获取数据的渠道,可以将数据分为两类:直接数据和间接数据。统计调查或科学实验通常是数据的直接来源,由此得到的原始数据一般称为直接数据或一手数据;而通过查阅资料获得的数据或他人对原始数据处理过的数据,一般称为间接数据或二手数据。例如,我 们用温度计实际测量得到的气温值是直接数据,而从网上搜索到的气温值是间接数据。5、数据的收集方法直接数据的收集方法有很多,如调查法、访谈法、观察法、实验法等。随着技术的发展,收集数据的手段日益丰富。例如,在农田中使用传
6、感器可以实时收集农田土壤含水率,用以指导精确灌溉;利用车载尾气检测技术可以获取实时的动态尾气数据,用以协助调整交通策略及城市规划;利用中国嫦娥四号探测器收集月球表面成分的第-手资料。间接数据一般都已经过加工处理,使用起来更加方便。收集间接数据的方法也有很多,如查阅文献资料、关注媒体资源、浏览权威网站、利用搜索引擎在网络中进行检索、从相关数据公司购买等。在收集这类数据时要综合考虑数据的时效性、可信度以及经济条件等方面的因素。6、数据分析数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息,并形成结论的过程。针对调查问卷收集的数据,我们可以分析问卷中不同指标的分布、所占比例等情
7、况,也可以进一步对问卷指标进行交叉分析,如性别不同,穿衣情况比例是不是也有所差异等,然后在分析的基础上得出结论。很多网络调查平台为用户提供了一些分析功能。1.2 数据的计算1、计算“数据”在“运算符”的操作下,按“规则”进行的数据变换,如“3+3=6”“3x2=6”,这是简单计算中的算术运算。通过建立分析模型和设计有效的步骤、方法,利用自动计算工具来进行规律预测和发现,这是计算机领域的计算。人类分析问题常采用的方法是计算,因此计算可以看作是一种获得信息的过程。2、电子表格软件.电子表格软件是面向大众的计算工具,它的图形用户界面及“所见即所得”的编辑技术等使对数据进行计算更加易于操作,从而更充分
8、地实现人和计算机的优势互补,提高人机协作效率。3、数据的排序利用电子表格软件排序功能可以依据关键字对表中的数据进行升序或降序排列,从而更清晰地了解各种分类信息。例如,我们希望找到身高最高的几位同学,可以依据身高进行排序。如果需要按照多个条件排序,可以进行多个关键字的设定。如图1.2.1所示,通过设置主要关键字、次要关键字,能很容易地找出女生中身高最高的几位同学。4、数据的筛选根据一定的规则成批筛选数据,有助于我们发现某类特定数据蕴含的信息。筛选会依据条件显示需要的数据,其余的内容都会被隐藏起来。同时,筛选不会以任何方式更改数据,取消筛选之后,所有数据都会重新出现。例如,筛选性别为男、爱好为篮球的数据,筛选后的结果如图1.2.2所示。4学科网(北京)股份有限公司