1、数据是蕴含信息的,信息是可以提取的,数据是蕴含信息的,信息是可以提取的,信息是为人们服务的信息是为人们服务的数据分析观念数据分析观念了解在现实生活中有许多问题应当先做调查研究,了解在现实生活中有许多问题应当先做调查研究,收集数据,通过分析做出判断,体会数据中蕴涵着收集数据,通过分析做出判断,体会数据中蕴涵着信息;信息;了解对于同样的数据可以有多种分析的方法,需要了解对于同样的数据可以有多种分析的方法,需要根据问题的背景选择合适的方法;根据问题的背景选择合适的方法;通过数据分析体验随机性,一方面对于同样的事情通过数据分析体验随机性,一方面对于同样的事情每次收集到的数据可能不同,另一方面只要有足够
2、每次收集到的数据可能不同,另一方面只要有足够的数据就可能从中发现规律。的数据就可能从中发现规律。数据分析是统计的核心。数据分析是统计的核心。 商店经理要合理地安排售货员的人数商店经理要合理地安排售货员的人数。售货员过多显然对商店是浪费,售货。售货员过多显然对商店是浪费,售货员太少将使一些顾客离去而减少商店收员太少将使一些顾客离去而减少商店收入。安排多少售货员依赖于顾客的人数入。安排多少售货员依赖于顾客的人数,而顾客的人数是随机的而顾客的人数是随机的,事先无法确,事先无法确定。商店经理有办法吗?定。商店经理有办法吗? 案例案例 售货员的人数售货员的人数 假定商店经理知道任一时刻来到假定商店经理知
3、道任一时刻来到k k个顾客的概率个顾客的概率p p如下:如下: k 0 1 2 3 4 5 6 7 7 p 0.03 0.10 0.14 0.19 0.21 0.19 0.09 0.04 0.01 尽管经理无法预料任一时刻顾客的确切人数。也不排尽管经理无法预料任一时刻顾客的确切人数。也不排除某一天一个顾客也没有,而另一天有上百名顾客涌入商除某一天一个顾客也没有,而另一天有上百名顾客涌入商店的极端情形。但是知道了上面的表,经理就可以知道,店的极端情形。但是知道了上面的表,经理就可以知道,安排安排7 7个售货员能以个售货员能以99%99%的概率使顾客不用等待。安排的概率使顾客不用等待。安排6 6个
4、售个售货员能以货员能以95%95%的概率使顾客不用等待。安排的概率使顾客不用等待。安排3 3个售货员顾客个售货员顾客要等待的概率大于要等待的概率大于50% 50% 等等。等等。这些信息无疑对经理安排售这些信息无疑对经理安排售货员的决策起着根本的作用。货员的决策起着根本的作用。案例案例 售货员的人数售货员的人数 标准标准在三个阶段都提出了相应的要在三个阶段都提出了相应的要求,这也成为了统计内容的首要主线。在求,这也成为了统计内容的首要主线。在第一学段中,提出第一学段中,提出“经历简单的数据收集经历简单的数据收集和整理过程和整理过程”;在第二学段中,提出;在第二学段中,提出“经经历简单的收集、整理
5、、描述和分析数据的历简单的收集、整理、描述和分析数据的过程(可使用计算器)过程(可使用计算器)”。一、数据分析过程一、数据分析过程大家喜欢吃的都不一样,到底买哪种水果呢?大家喜欢吃的都不一样,到底买哪种水果呢?请你帮我想想办法?请你帮我想想办法? 掌握必要的收集数据、整理数据、描述掌握必要的收集数据、整理数据、描述数据和分析数据的方法,无疑是统计课程数据和分析数据的方法,无疑是统计课程内容的第二条主线。内容的第二条主线。二、数据分析方法二、数据分析方法在收集数据方面,所涉及的数据可能是全体的数在收集数据方面,所涉及的数据可能是全体的数据(总体数据),也可能是通过抽样获得的数据据(总体数据),也
6、可能是通过抽样获得的数据(抽样数据)。在第一、第二学段中,学生收集(抽样数据)。在第一、第二学段中,学生收集的基本都是总体数据的基本都是总体数据现成的数据;需要自己调查的数据(换乳牙、看现成的数据;需要自己调查的数据(换乳牙、看电视的时间)。电视的时间)。 常用的收集数据的方法包括:常用的收集数据的方法包括: 调查、试验、测量、查阅资料。调查、试验、测量、查阅资料。学生应该对收集数据的方法都有比较丰富的体验。学生应该对收集数据的方法都有比较丰富的体验。标准标准在第一学段提出在第一学段提出“了解调查、测量等收了解调查、测量等收集数据的简单方法集数据的简单方法”;在第二学段提出在第二学段提出“会根
7、据实际问题设计简单的调会根据实际问题设计简单的调查表,能选择适当的方法(如调查、试验、测量)查表,能选择适当的方法(如调查、试验、测量)收集数据收集数据”“”“能从报纸杂志、电视等媒体中,有能从报纸杂志、电视等媒体中,有意识地获得一些数据信息意识地获得一些数据信息”。 研究表明在计划如何收集数据上花时间是研究表明在计划如何收集数据上花时间是值得的。值得的。 美国数学教师杂志向全美的中小学数学教师推荐的一节美国数学教师杂志向全美的中小学数学教师推荐的一节数学课数学课 为什么有的人跑得快?有的人跑得慢?为什么有的人跑得快?有的人跑得慢? 师:今天我们一起讨论一个问题,大家有没有想过这样师:今天我们
8、一起讨论一个问题,大家有没有想过这样的事情,我们都有跑步的体验,为什么有的人跑得快,有的事情,我们都有跑步的体验,为什么有的人跑得快,有的人跑得慢?的人跑得慢? 有的学生说:有的学生说:“谁个高谁就跑得快,谁个矮谁跑得慢谁个高谁就跑得快,谁个矮谁跑得慢.” 马上就有学生提出问题:马上就有学生提出问题:“老师,不对,我们班老师,不对,我们班个子不高,但他跑得很快个子不高,但他跑得很快.” 随后学生又提出问题:随后学生又提出问题:“我们班有两个学生,他们的我们班有两个学生,他们的个子一般高,结果一个人跑得快,一个人跑得慢个子一般高,结果一个人跑得快,一个人跑得慢.” 案例案例 过程二:过程二:用用
9、100米跑的步数米跑的步数m1,m6与时间与时间t1,t6的比可以算出每个人的步频的比可以算出每个人的步频. 步频,每个人步频,每个人1秒钟跨了多少步秒钟跨了多少步.如果跨了如果跨了150步,步,总共用总共用9秒秒8,两数一除,我就知道,两数一除,我就知道1秒钟跨了多少步秒钟跨了多少步.有了步数,有了时间就可以算出步频有了步数,有了时间就可以算出步频. 于是有的学生猜测步频越大,跑得越快,结果发于是有的学生猜测步频越大,跑得越快,结果发现,总体的状况是这样,步频比较高的人,他跑的现,总体的状况是这样,步频比较高的人,他跑的成绩是比较好的成绩是比较好的. 一个人跑得快,都受哪些因素影响呢?是由一
10、个人跑得快,都受哪些因素影响呢?是由2个个因素影响的,步距与步频因素影响的,步距与步频. 这就是美国小学六年级讨这就是美国小学六年级讨论的问题论的问题. 实际问题中收集数据的有趣案例实际问题中收集数据的有趣案例 对种群的估计对种群的估计 对敏感性问题的调查对敏感性问题的调查2.整理、描述、分析数据的方法整理、描述、分析数据的方法在第一学段,学生将学习分类的方法,分类在第一学段,学生将学习分类的方法,分类是整理数据和描述数据的开始。在此基础上,是整理数据和描述数据的开始。在此基础上,能用自己的方式(文字、图画、表格等)呈能用自己的方式(文字、图画、表格等)呈现整理数据的结果,而不学习正式的统计图
11、现整理数据的结果,而不学习正式的统计图表或统计量。表或统计量。有研究表明,早期经验的多样化,有助于儿有研究表明,早期经验的多样化,有助于儿童建立进一步学习的经验和兴趣。童建立进一步学习的经验和兴趣。全班同学的身高情况全班同学的身高情况 单位:厘米单位:厘米第第1 1小组小组116116128128124124135135128128141141第第2小组小组129129130130134134127127134134138138第第3 3小组小组138138142142119119123123127127146146第第4 4小组小组119119137137136136138138150150
12、152152第第5 5小组小组125125120120131131143143135135148148第第6 6小组小组1381381321321471471391391481481391392.整理、描述、分析数据的方法整理、描述、分析数据的方法在第二学段,学生将学习条形统计图、扇形在第二学段,学生将学习条形统计图、扇形统计图、折线统计图等常见的统计图,并且统计图、折线统计图等常见的统计图,并且能用它们直观、有效地表示数据。能用它们直观、有效地表示数据。第二学段还将学习一个重要的刻画数据集中第二学段还将学习一个重要的刻画数据集中趋势的统计量趋势的统计量平均数。平均数。案例:从下图中,你能获取
13、哪些信息?一、五案例:从下图中,你能获取哪些信息?一、五年级学生的情况有什么不同?能尝试解释原因年级学生的情况有什么不同?能尝试解释原因吗?吗? 一年级、五年级学生睡眠情况统计图一年级、五年级学生睡眠情况统计图 张思明、史宁中的看法张思明、史宁中的看法张:最大的差别;差别的原因和合理性;指标有问题,能否合并;人均睡眠时间也许更好史:目标;变化趋势;注意到人数不同;经验的积累 某工厂有某工厂有5个股东,个股东,100个工人。工人的工资总额与工厂个工人。工人的工资总额与工厂的股东总利润见下:的股东总利润见下: 年度年度 工人工资总额工人工资总额 股东总利润股东总利润 1990 1990年年 101
14、0万元万元 5 5万元万元 1991 1991年年 12.512.5万元万元 7.57.5万元万元 1992 1992年年 1515万元万元 1010万元万元 该工厂老板根据表中数据,作出了右图,该工厂老板根据表中数据,作出了右图,并声称股东和工人并声称股东和工人“有福共享、有难同当有福共享、有难同当”,你如何看待他的说法?你如何看待他的说法? 案例案例 “有福同享有福同享, ,有难同当有难同当”吗吗? ?案例案例 “有福同享有福同享, ,有难同当有难同当”吗吗? ? 平均数、中位数、众数平均数、中位数、众数极差、方差、标准差极差、方差、标准差 平均数的三个角度:算法理解、概念平均数的三个角度
15、:算法理解、概念理解、统计理解。理解、统计理解。小学阶段不要求中位数、众数小学阶段不要求中位数、众数 2.整理、描述、分析数据的方法整理、描述、分析数据的方法教学中应鼓励学生运用所学习的方法,尽可能多地教学中应鼓励学生运用所学习的方法,尽可能多地从数据中提取有用的数据,并且能够根据问题的背从数据中提取有用的数据,并且能够根据问题的背景选择合适的方法,而不是单纯地名词、计算方法景选择合适的方法,而不是单纯地名词、计算方法等的掌握。等的掌握。需要我们根据问题的背景选择合适的统计图。总之,需要我们根据问题的背景选择合适的统计图。总之,“统计学对结果的判断标准是统计学对结果的判断标准是好坏好坏”,而不
16、是,而不是“对错对错”。 数据的随机主要有两层涵义:一方面对于数据的随机主要有两层涵义:一方面对于同样的事情每次收集到的数据可能会是不同同样的事情每次收集到的数据可能会是不同的;另一方面只要有足够的数据就可能从中的;另一方面只要有足够的数据就可能从中发现规律。发现规律。 两个案例:摸球、上学时间两个案例:摸球、上学时间概率也是研究随机现象的,那么为什么又提出数据的随机性呢?实际上,统计与概率都是研究随机现象的学科。统计与概率正是从不同的角度研究如何刻画随机现象,统计侧重于从数据来刻画随机,概率侧重于建立理论模型来刻画随机 。鼓励学生运用数据来体会随机,更能体会随机的特点。我并不是反对前一种教法
17、本身,而是说如果这么教,蕴含的随机思想并不强,学生也不感兴趣,都知道了概率为什么还要做实验。而后来的这种教法,学生体会到每一次摸的结果事先都不知道,但是摸多了能够帮助我们做一些判断。这样一来,学生既体会了随机,又感受到了数据中蕴含着信息,我想这种类似于“猜谜”的活动学生也会很有兴趣”。实际上这种“猜谜”绝不是“瞎猜”,在标准案例40的说明中给出了这种推断背后的科学依据,也就是虽然不能保证估计得完全一致,但能保证在一定实验次数下,估计值与实际情况相差不大的可能性是很大的。实际上,如果袋中装有4个红球和1个白球,可以知道摸到红球的概率为4/5(也就是8/10)。通过计算可以得到:保证有80%以上的
18、可能使得“摸到红球的频率在7/10到9/10之间”,需要摸27次以上;保证有95%以上的可能使得“摸到红球的频率在7/10到9/10之间”,需要摸60次以上。案例案例:蒙特卡罗方法蒙特卡罗方法频率与概率的关系频率与概率的关系 模拟试验模拟试验案例案例 公共汽车门的高度公共汽车门的高度 汽车设计手册中指出:人的身高服从正态分汽车设计手册中指出:人的身高服从正态分布布N N(, ,2 2)。)。根据各国统计资料,可以得到根据各国统计资料,可以得到各国男子身高的各国男子身高的和和2 2。对于中国人,对于中国人,=1.75=1.75,=0.05=0.05。现要求上下车要低头的男子的概率不现要求上下车要
19、低头的男子的概率不超过超过0.5%0.5%,车门需要有多高。,车门需要有多高。 统计与概率的应用实例统计与概率的应用实例(1 1)工程系统设计)工程系统设计(2 2)博彩业的监督)博彩业的监督(3 3)劳动保护)劳动保护(4 4)社情分析:读图时代、民意测验)社情分析:读图时代、民意测验(5 5)工业质量控制)工业质量控制(6 6)犯罪学:检查足迹)犯罪学:检查足迹(7 7)数理语言学)数理语言学(8 8)金融学)金融学(9 9)文学著作权)文学著作权(1010)天王星光环的发现)天王星光环的发现 统计与概率的应用实例统计与概率的应用实例 书籍书籍在终级的分析中,在终级的分析中, 一切知识都是历史;一切知识都是历史;在抽象的意义下,在抽象的意义下,一切科学都是数学;一切科学都是数学;在理性的世界里,在理性的世界里,所有的判断都是统计学。所有的判断都是统计学。 著名统计学家著名统计学家C. R. Rao 结结 语语谢 谢!