1、第九章第九章 统计统计第九章第九章 统计统计9 9. .2 2 用样本估计总体用样本估计总体9.2.1 总体取值规律的估计(第1课时)第九章 统计第九章第九章 统计统计第九章第九章 统计统计 收集数据是为了寻找数据中蕴含的信息收集数据是为了寻找数据中蕴含的信息. .因为实际问题中因为实际问题中数据数据多而且杂乱多而且杂乱,往往,往往无法直接从原始数据中发现规律无法直接从原始数据中发现规律, ,所以需要根据所以需要根据问题的背景特点,选择合适统计图表对数据进行整理和直观描述问题的背景特点,选择合适统计图表对数据进行整理和直观描述. . 在此基础上,通过数据分析,找出数据中蕴含的信息在此基础上,通
2、过数据分析,找出数据中蕴含的信息, ,就可以用这就可以用这些信息来解决实际问题了些信息来解决实际问题了. .1.1.通过调查获取数据通过调查获取数据2 2. .通过试验获取数据通过试验获取数据3 3. .通过观察获取数据通过观察获取数据4 4. .通过查询获得数据通过查询获得数据获取数据的基本途径获取数据的基本途径:第九章第九章 统计统计第九章第九章 统计统计问题1 我国是世界上严重缺水的国家之一,城市缺水问题较为突出. 某市政府为了减少水资源的浪费,计划对居民生活用水费用实施阶梯式水价制度,即确定一户居民月均用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费,如果希望确定一
3、个比较合理的标准,以使大部分居民用户的水费支出不受影响,你认为需要做哪些工作? 每户居民月均用水量标准如果定得每户居民月均用水量标准如果定得太低太低, ,会影响很多居民会影响很多居民的日常生活的日常生活;如果标准;如果标准太高太高, ,则不利于节水则不利于节水、为了确定一个较、为了确定一个较为合理的用水标准,必须先了解在全市所有居民用户中为合理的用水标准,必须先了解在全市所有居民用户中, ,月用月用水量在不同范围内的居民用户所占的比例情况水量在不同范围内的居民用户所占的比例情况. .第九章第九章 统计统计第九章第九章 统计统计 假设通过简单随机抽样,获得了假设通过简单随机抽样,获得了10010
4、0户居民用户的月均用水量户居民用户的月均用水量数据数据( (单位单位: t): t):9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.09.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.02.2 8.61 3.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5 2.2 8.61 3.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5 2.1 2.1 5.7 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.94.92
5、.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 2 22.42.43.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.03.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.022.2 10.8 5.5 2.02 4.3 9.9 3.6 5.6 4.4 7.922.2 10.8 5.5 2.02 4.3 9.9 3.6 5.6 4.4 7.95.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7
6、5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.75.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.35.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.35.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.85.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.87.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.67.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6最小值是最小
7、值是1.3t,1.3t,最大值是最大值是28.0t28.0t. . 第九章第九章 统计统计第九章第九章 统计统计 为了更深人地挖掘数据蕴含的信息为了更深人地挖掘数据蕴含的信息, ,需要对数据作进一步需要对数据作进一步的整理与分析的整理与分析. .在实际问题中,我们更关心什么问题?在实际问题中,我们更关心什么问题?月均用水量在不同范围内的居民用户占全市居民用户的比例月均用水量在不同范围内的居民用户占全市居民用户的比例. .第九章第九章 统计统计第九章第九章 统计统计 此样本观测数据的最小值是此样本观测数据的最小值是1.3t1.3t,最大值是,最大值是28.0t28.0t,极差为极差为28.028
8、.0- -1.3=26.71.3=26.7。这说明样本观测数据的变化范围是。这说明样本观测数据的变化范围是26.7t26.7t. .1.1.求极差求极差极差为一组数据中最大值与最小值的差极差为一组数据中最大值与最小值的差. .2 2. .决定组距与组数决定组距与组数8 8. .9 9,3 32 26 6. .7 7组组距距极极差差 组数太多或太少,都会影响我们了解数据的分布情况组数太多或太少,都会影响我们了解数据的分布情况. .组距与组距与组数的确定没有固定的标准,常常需要一个尝试和选择的过程组数的确定没有固定的标准,常常需要一个尝试和选择的过程. .决决定组距与组数:当样本容量不超过定组距与
9、组数:当样本容量不超过100100时,常分成时,常分成5 51212组,为了组,为了方便起见,一般取等长组距,并且组距应力求方便起见,一般取等长组距,并且组距应力求“取整取整”第九章第九章 统计统计第九章第九章 统计统计 由于组距为由于组距为3 3,9 9个组距的长度超过极差个组距的长度超过极差, ,我们可以使第一组我们可以使第一组的左端点略小于数据中的最小值的左端点略小于数据中的最小值, ,最后一组的右端点略大于数最后一组的右端点略大于数据中的最大值据中的最大值. .例如,可以取区间为例如,可以取区间为1.2,28.21.2,28.2,按如下方式,按如下方式把样本观测数据以组距把样本观测数据
10、以组距3 3分为分为9 9组组: : 1.2 1.2,4.2)4.2),4.24.2,7.2)7.2), ,25.225.2,28.2.28.2.计算各小组的频率,例如第一小组的频率是计算各小组的频率,例如第一小组的频率是0 0. .2 23 3. .1 10 00 02 23 3样样本本容容量量第第一一组组频频数数3 3. .将数据分组将数据分组4 4. .列频率分布表列频率分布表第九章第九章 统计统计第九章第九章 统计统计作出频率分布表作出频率分布表( (如下表如下表) ):第九章第九章 统计统计第九章第九章 统计统计 频率分布频率分布直方图与频数直方图与频数分布直方图有分布直方图有什么区
11、别什么区别? ?根据上表可以得到如下图所示的频率分布直方图根据上表可以得到如下图所示的频率分布直方图. .月均用水量月均用水量/t/t0.077频率频率/ /组距组距0.1070.0430.030 0.0300.0170.0100.0130.00700.020.080.10.060.044.21.27.2 10.2 13.2 16.2 19.2 22.2 25.2 28.25 5. .画频率分布直方图画频率分布直方图频率分布直方图的优频率分布直方图的优点点:把样本数据落在:把样本数据落在各小组的比例大小各小组的比例大小直直观化观化,更有利于我们,更有利于我们从整体上把握数据从整体上把握数据分分
12、布的特点布的特点. .第九章第九章 统计统计第九章第九章 统计统计月均用水量月均用水量/t/t0.077频率频率/ /组距组距0.1070.0430.030 0.0300.0170.0100.0130.00700.020.080.10.060.044.21.27.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2(1)(1)纵轴表示什么?纵轴表示什么?(1)(1)纵轴表示纵轴表示 , 就是小长方形的高就是小长方形的高, ,它反映了各组样本观它反映了各组样本观 测数据的疏密程度测数据的疏密程度. .组组距距频频率率组组距距频频率率第九章第九章 统计统计第九章第九章 统计统计
13、月均用水量月均用水量/t/t0.077频率频率/ /组距组距0.1070.0430.030 0.0300.0170.0100.0130.00700.020.080.10.060.044.21.27.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2(2)(2)小长方形的面积等于什么?小长方形的面积等于什么?(2)(2)小长方形的面积小长方形的面积= =组距组距 = =频率频率. . 频率分布直方图就以面积频率分布直方图就以面积 的形式反映了数据落在各个小组的频率的的形式反映了数据落在各个小组的频率的大小大小. .组组距距频频率率第九章第九章 统计统计第九章第九章 统计统计
14、月均用水量月均用水量/t/t0.077频率频率/ /组距组距0.1070.0430.030 0.0300.0170.0100.0130.00700.020.080.10.060.044.21.27.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2(3)(3)小长方形的面积之和为多少?小长方形的面积之和为多少?(3)(3)小长方形的面积之和为小长方形的面积之和为1 1, ,即样本数据落在整个区间的频率为即样本数据落在整个区间的频率为1 1. .第九章第九章 统计统计第九章第九章 统计统计 观察观察上表上表和和上图上图, ,你觉得这组数据中蕴含了哪些有用的信息你觉得这组数据
15、中蕴含了哪些有用的信息? ?你能从图表中发现居民用户月均用水量的哪些分布规律你能从图表中发现居民用户月均用水量的哪些分布规律? ?你能给出你能给出适当的语言描述吗适当的语言描述吗? ? 从频率分布表可以清楚地看出从频率分布表可以清楚地看出, ,样本观测数据落在各个小组的比例大小,样本观测数据落在各个小组的比例大小,例如例如, ,月均用水量在区间月均用水量在区间4.2,7.2)4.2,7.2)内的居民用户最多内的居民用户最多, ,在区间在区间1.2,4.2)1.2,4.2)内内的次之,而月均用水量超过的次之,而月均用水量超过16.216.2的各区间内数据所占比例较小,等等的各区间内数据所占比例较
16、小,等等. . 从频率分布直方图容易看出从频率分布直方图容易看出, ,居民用户月均用水量的样本观测数据的分居民用户月均用水量的样本观测数据的分布是不对称的,图形的左边高、右边低布是不对称的,图形的左边高、右边低, ,右边有一个较长的右边有一个较长的“尾巴尾巴”这表明这表明大部分居民用户的月均用水量集中在一个较低值区域,尤其在区间大部分居民用户的月均用水量集中在一个较低值区域,尤其在区间1.2,7.2)1.2,7.2)最为集中,少数居民用户的月均用水量偏多最为集中,少数居民用户的月均用水量偏多, ,而且随着月均用水量的增加而且随着月均用水量的增加, ,居居民用户数呈现降低趋势民用户数呈现降低趋势
17、. .第九章第九章 统计统计第九章第九章 统计统计 分别以分别以3 3和和2727为组数,对数据进行等距分组为组数,对数据进行等距分组, ,画出画出100100户居民用户居民用户月均用水量的频率分布直方图户月均用水量的频率分布直方图. .观察图形,你发现不同的组数对观察图形,你发现不同的组数对于直方图呈现数据分布规律有什么影响于直方图呈现数据分布规律有什么影响? ?月均用水量月均用水量/t/t频率频率/ /组距组距1.210.219.228.2第九章第九章 统计统计第九章第九章 统计统计月均用水量月均用水量/t/t频率频率/ /组距组距1.211.221.228.23.2 5.2 7.2 9.
18、22.24.2 6.2 8.2 10.212.213.214.215.216.217.218.219.220.2 22.223.224.225.226.227.2第九章第九章 统计统计第九章第九章 统计统计例例1 1 某高校调查了某高校调查了200200名学生每周的自习时间名学生每周的自习时间( (单位单位: :小时小时),),制成了制成了 如图所示的频率分布直方图如图所示的频率分布直方图, ,其中自习时间范围是其中自习时间范围是17.517.5, ,3030, 样本数据分组为样本数据分组为17.517.5, ,20)20), ,2020, ,22.5)22.5), ,22.5,25)22.5
19、,25), ,2525, ,27.5)27.5), , 27.5 27.5,30).30).根据直方图,根据直方图,a=a= ,这这200200名学生中每周的名学生中每周的 自习时间不少于自习时间不少于22.522.5小时的人数是小时的人数是_._.自习时间/小时频率/组距O2022.517.52527.5300.020.160.10a0.040.080.08140140第九章第九章 统计统计第九章第九章 统计统计例例2 2 某家庭记录了未使用节水龙头某家庭记录了未使用节水龙头5050天的日用水量数据天的日用水量数据( (单位:单位:m m3 3) ) 和使用了节水龙头和使用了节水龙头5050
20、天日用水量数据天日用水量数据, ,得到频数分布表如下:得到频数分布表如下: 未使用节水龙头未使用节水龙头5050天的日用水量频数分布表天的日用水量频数分布表日用水量日用水量 0,0.1)0,0.1) 0.1,0.2)0.1,0.2)0.2,0.3)0.2,0.3)0.3,0.4)0.3,0.4)0.4,0.5)0.4,0.5)0.5,0.6)0.5,0.6) 0.6,0.7)0.6,0.7)频数频数1 13 32 24 49 926265 5使用了节水龙头使用了节水龙头5050天的日用水量频数分布表天的日用水量频数分布表日用水量日用水量 0,0.1)0,0.1) 0.1,0.2)0.1,0.2
21、)0.2,0.3)0.2,0.3)0.3,0.4)0.3,0.4)0.4,0.5)0.4,0.5)0.5,0.6)0.5,0.6)频数频数1 15 51313101016165 5(1)(1)在下图中作出使用了节水龙头在下图中作出使用了节水龙头5050天的日用水量数据的频率天的日用水量数据的频率 分布直方图;分布直方图;(3)(3)估计该家庭使用节水龙头后估计该家庭使用节水龙头后, ,一年能节省多少水?一年能节省多少水?( (一年按一年按 365365天计算天计算, ,同一组中的数据以这组数据所在区间中点的值同一组中的数据以这组数据所在区间中点的值 作代表作代表) )(2)(2)估计该家庭使用
22、节水龙头后,日用水量小于估计该家庭使用节水龙头后,日用水量小于0.35m0.35m3 3的频率;的频率;第九章第九章 统计统计第九章第九章 统计统计解:解:(1)(1)日用水量日用水量 0,0.1)0,0.1) 0.1,0.2)0.1,0.2)0.2,0.3)0.2,0.3)0.3,0.4)0.3,0.4)0.4,0.5)0.4,0.5)0.5,0.6)0.5,0.6)频数频数1 15 51313101016165 5日用水量/t频率/组距00.20.30.10.40.50.60.23.43.23.02.82.62.42.22.01.81.61.41.21.00.80.60.4第九章第九章 统计统计第九章第九章 统计统计第九章第九章 统计统计第九章第九章 统计统计小结:第九章第九章 统计统计第九章第九章 统计统计