1、2.2 总总体体分分布布的的估估计计用样本估计总体用样本估计总体 用样本估计总体用样本估计总体(两种):两种):一种是:用样本的频率分布估计总体的一种是:用样本的频率分布估计总体的分布。分布。另一种是:用样本的数字特征(平均数另一种是:用样本的数字特征(平均数标准差等)估计总体的数字特征。标准差等)估计总体的数字特征。用样本的频率分布估计总体分布用样本的频率分布估计总体分布一一 频率分布图和频率分布直方图频率分布图和频率分布直方图频率分布折线图频率分布折线图 和总体密度曲线和总体密度曲线三三 茎叶图(茎叶图(stem-and-leaf display)2.2.1 用样本的频率分布估计总体分布我
2、国是世界上严重缺水我国是世界上严重缺水的国家之一,城市缺水的国家之一,城市缺水问题较为突出,某市政问题较为突出,某市政府为了节约生活用水,府为了节约生活用水,计划在本市试行居民生计划在本市试行居民生活用水定额管理,即确活用水定额管理,即确定一个居民月用水量标定一个居民月用水量标准准a a,用水量不超过,用水量不超过a a的的部分按平价收费,超出部分按平价收费,超出a a的部分按议价收费。的部分按议价收费。如果希望大部分居民的如果希望大部分居民的日常生活不受影响,那日常生活不受影响,那么标准么标准a a定为多少比较定为多少比较合理呢合理呢?探究探究:你认为,为了较为你认为,为了较为合理地确定出这
3、个合理地确定出这个标准,需要做哪些标准,需要做哪些工作?工作?我国是世界上严重缺水我国是世界上严重缺水的国家之一,城市缺水的国家之一,城市缺水问题较为突出,某市政问题较为突出,某市政府为了节约生活用水,府为了节约生活用水,计划在本市试行居民生计划在本市试行居民生活用水定额管理,即确活用水定额管理,即确定一个居民月用水量标定一个居民月用水量标准准a a,用水量不超过,用水量不超过a a的的部分按平价收费,超出部分按平价收费,超出a a的部分按议价收费。的部分按议价收费。如果希望大部分居民的如果希望大部分居民的日常生活不受影响,那日常生活不受影响,那么标准么标准a a定为多少比较定为多少比较合理呢
4、合理呢?探究探究:采用抽样调查的方采用抽样调查的方式获得样本数据式获得样本数据分析样本数据来估分析样本数据来估计全市居民用水量的计全市居民用水量的分布情况分布情况下表给出下表给出100100位居民的月均用水量表位居民的月均用水量表 分析数据的一种基本方法是用图将它们画出来,或者分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提信息。表格则是通过改变数据的构成形式,为我们提
5、供解释数据的新方式供解释数据的新方式讨论:如何分讨论:如何分析数据?析数据?根据这些数据根据这些数据你能得出用水你能得出用水量其他信息吗量其他信息吗?为此我们要对这些数据进行整理与分析为此我们要对这些数据进行整理与分析一一频率分布的概念:频率分布的概念:频率分布频率分布是指一个样本数据在各个小范围是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方内所占比例的大小。一般用频率分布直方图反映样本的频率分布图反映样本的频率分布 二二画画频率分布直方图频率分布直方图其其一般步骤一般步骤为:为:(1 1)计算一组数据中最大值与最小值的差,)计算一组数据中最大值与最小值的差,即求极差即求极差
6、(2 2)决定组距与组数)决定组距与组数(3 3)将数据分组)将数据分组(4 4)列频率分布表)列频率分布表(5 5)画频率分布直方图)画频率分布直方图第一步第一步:求极差求极差:(数据组中最大值与最小值的差距数据组中最大值与最小值的差距)最大值最大值=4.3 =4.3 最小值最小值=0.2 =0.2 所以极差所以极差=4.3-0.2=4.1=4.3-0.2=4.1第二步第二步:决定组距与组数决定组距与组数:(强调取整)(强调取整)当样本容量不超过当样本容量不超过100100时时,按照数据的多少按照数据的多少,常常分成分成512512组组.为方便组距的选择应力求为方便组距的选择应力求“取整取整
7、”.本题如果组距为本题如果组距为0.5(t).0.5(t).则则 4.18.20.5极差组数=组距第三步第三步:将数据分组:将数据分组:(给出组的界限给出组的界限)所以将数据分成所以将数据分成9 9组较合适组较合适.0,0.5),0.5,1),1,1.5),4,4.5)共共9组组.第四步第四步:列频率分布表列频率分布表.分组分组频数频数频率频率频率频率/组距组距0-0.5)40.5-1)8 1-1.5)15 1.5-2)22 2-2.5)25 2.5-3)15 3-3.5)5 3.5-4)4 4-4.5)2合计合计100组距组距=0.5=0.5 0.040.080.080.160.30.150
8、.440.220.250.512.000.020.040.040.080.10.30.150.0500.10.20.30.40.50.6 0.5 1 1.5 2 2.5 3 3.5 4 4.5第第五五步步:画画出出频频率率分分布布直直方方图图.频率频率/组距组距 月均用水量月均用水量/t/t (组距组距=0.5)=0.5)0.080.160.30.440.50.30.10.080.04小长方形的面小长方形的面积积=?=?小长方形的面小长方形的面积总和积总和=?=?月均用水量最月均用水量最多的在哪个区多的在哪个区间间?请大家阅读第请大家阅读第6868页页,直方图有直方图有哪些优点和缺哪些优点和缺
9、点点?频率分布直方图的特征:频率分布直方图的特征:从频率分布直方图可以清楚的看出从频率分布直方图可以清楚的看出数据分布的总体趋势。数据分布的总体趋势。从频率分布直方图得不出原始的数从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。原有的具体数据信息就被抹掉了。思考思考:1.频率分布表与频率分布直方图的区别?频率分布表与频率分布直方图的区别?频率分布表频率分布表列出的是在各个不同区间内取值的列出的是在各个不同区间内取值的频率。频率。频率分布直方图频率分布直方图是用小长方形面积的大小来表是用小长方形面积的大小来表示在各个区间内取
10、值的频率示在各个区间内取值的频率。2.2.如果当地政府希望使如果当地政府希望使85%85%以上的居民每月的以上的居民每月的用水量不超出标准,根据频率分布表用水量不超出标准,根据频率分布表2-22-2和频和频率分布直方图率分布直方图2.2-12.2-1,你能对制定月用水量标准提出建议吗你能对制定月用水量标准提出建议吗?3.将组距确定为将组距确定为1 1,作出教材,作出教材P66P66页页 居民月居民月均用水量的频率分布直方图均用水量的频率分布直方图 4.谈谈两种组距下,你对图的印象?同一个样谈谈两种组距下,你对图的印象?同一个样本数据,绘制出来的分布图是唯一的吗?本数据,绘制出来的分布图是唯一的
11、吗?(同样一组数据,如果组距不同,横轴、纵(同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断时会影响我们对总体的判断 )练练 习习1.有一个容量为有一个容量为50的样本数据分组的频数如下的样本数据分组的频数如下12.5,15.5)315.5,18.5)818.5,21.5)921.5,24.5)1124.5,27.5)1027.5,30.5)530.5,33.5)4(1)列出样本的频率分布表列出样本的频率分布表;(2)画出频率分布直
12、方图画出频率分布直方图;(3)根据频率分布直方图估计根据频率分布直方图估计,数据落在数据落在15.5,24.5)的百分比是多少)的百分比是多少?解解:组距为组距为3 分组分组 频数频数 频率频率 频率频率/组距组距12.5,15.5)315.5,18.5)818.5,21.5)921.5,24.5)1124.5,27.5)1027.5,30.5)530.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027频率分布直方图如下频率分布直方图如下:频率频率组距组距0.0100.0200.0300.0400.05
13、012.5 15.50.0600.0701、求极差、求极差(即一组数据中最大值与最小值的差即一组数据中最大值与最小值的差)知道这组数据的变动范围知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(将数据分组)、决定组距与组数(将数据分组)3、将数据分组将数据分组(8.2取整取整,分为分为9组组)小结小结:画频率分布直方图的步骤画频率分布直方图的步骤4、列出、列出频率分布表频率分布表.(填写频率填写频率/组距一栏组距一栏)5、画出、画出频率分布直方图频率分布直方图。组距组距:指每个小组的两个端点的距离,组距指每个小组的两个端点的距离,组距组数组数:将数据分组,当数据在将数据分组,当数
14、据在100个以内时,个以内时,按数据多少常分按数据多少常分5-12组。组。4.18.20.5极差组数=组距注意注意第几组频数(1)第几组频率样本容量(2)纵坐标为纵坐标为:频率组距2 2、一个容量为、一个容量为2020的样本数据的样本数据.分组后分组后.组距与频组距与频数如下:数如下:(0,20 2;(20,30 3,(30,40 4;(0,20 2;(20,30 3,(30,40 4;(40,50 5;(50,60 4;(60,70 2(40,50 5;(50,60 4;(60,70 2。则样。则样本在本在(,50,50上的频率为:上的频率为:,7/10(2019,江西)4为了了解某地区高三
15、学生的身体发育情况,抽为了了解某地区高三学生的身体发育情况,抽查了该地区查了该地区100名年龄为名年龄为17.5岁岁18岁的男生体重岁的男生体重(kg),得到频率分布直方图如下:得到频率分布直方图如下:C0.030.050.07体重体重(kg)频率频率/组距组距54.5 58.5 62.5 66.5 70.5 74.5 根据上图可得这根据上图可得这100名学生中体重在名学生中体重在56.5,64.5的学生人数是的学生人数是()A.20 B.30 C.40 D.502400 2700 3000 3300 3600 3900X 体重体重y0.0013 3、观察新生婴儿的体重,其频率分布直方图、观察
16、新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重如图所示,则新生婴儿体重(2700,3000)(2700,3000)的频的频率为:率为:;0.30.30.14.34.54.74.95.1视力视力频率频率/组距组距AA.0.27,78B.0.27,83C.2.7,78D.2.7,836、某射手对、某射手对100个靶各射击个靶各射击5次,记下命中次,记下命中数,设计结果如下:数,设计结果如下:频数频数43210命中数命中数514312918351、列出频率分布表;、列出频率分布表;2、画出分布频率条形图;、画出分布频率条形图;3、求命中不少于、求命中不少于3次的概率。次的概率。(2019,
17、东北)频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O月均用水量月均用水量/t月均用水量月均用水量/t频率频率组距组距a bO月均用水量月均用水量/t频率频率组距组距a bO总体密度曲线总体在区间总体在区间(a,b)内取)内取值的百分比值的百分比.0123480 50 5 71 1 53茎茎叶叶【问题问题】某赛季甲、乙两名篮球运动员每场某赛季甲、乙两名篮球运动员每场 比赛的得分情况如下:比赛的得分情况如下:甲运动
18、员得分:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.【问题问题】某赛季甲、乙两名篮球运动员每场某赛季甲、乙两名篮球运动员每场 比赛的得分情况如下:比赛的得分情况如下:甲运动员得分:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.甲甲 乙乙 84 6 3 3 6 83 8 9 1012345 5 4 6 1 6 7 9 9 0 甲运动员得分:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.甲甲 乙乙 84 6 3 3 6 83 8 9 1012345 5 4 6 1 6 7 9 9 0
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。