1、北师大版高中数学必修3一章-统计-5-用样本估计总体-51.1.学会用样本的频率分布估计总体学会用样本的频率分布估计总体.2.2.会根据样本数据画出频率分布直方图及会根据样本数据画出频率分布直方图及频率分布折线图频率分布折线图.从前面的分析可以知道,当研究一个对象时,如从前面的分析可以知道,当研究一个对象时,如果能得到它们的全部数据(可以看作是总体),我果能得到它们的全部数据(可以看作是总体),我们就可以直接从中分析总体的各种信息们就可以直接从中分析总体的各种信息.如人口普查如人口普查得到的数据较为全面,从中可以很好地反映对象的得到的数据较为全面,从中可以很好地反映对象的重要信息重要信息.但是
2、,在实际问题中,总体的信息往往不但是,在实际问题中,总体的信息往往不能全部得到,因此我们需要进行抽样调查,从总体能全部得到,因此我们需要进行抽样调查,从总体中抽取一部分作为样本,并用样本的各种信息来估中抽取一部分作为样本,并用样本的各种信息来估计总体的情况,包括它的分布和基本数字特征计总体的情况,包括它的分布和基本数字特征.如何通过样本来估计总体的分布情况呢?如何通过样本来估计总体的分布情况呢?这就需要我们先将样本的分布情况表示出来这就需要我们先将样本的分布情况表示出来.例例 18951895年,在英国伦敦有年,在英国伦敦有106106块男性头盖骨被挖掘块男性头盖骨被挖掘出出.经考证,这些头盖
3、骨的主人死于经考证,这些头盖骨的主人死于1665166516661666年年之间的大瘟疫之间的大瘟疫.人类学家分别测量了这些头盖骨的宽人类学家分别测量了这些头盖骨的宽度,数据如下所示(单位:度,数据如下所示(单位:mmmm),请你估计在),请你估计在1665166516661666年之间,英国男性头盖骨宽度的分布情年之间,英国男性头盖骨宽度的分布情况况.解:解:如果把总体看作如果把总体看作是是1665166516661666年之间年之间的英国男性头盖骨的的英国男性头盖骨的宽度,那么我们就是宽度,那么我们就是通过上面挖掘出土得通过上面挖掘出土得到的样本信息,来估到的样本信息,来估计总体的分布情况
4、计总体的分布情况.但但从上面的数据很难直从上面的数据很难直接估计出总体的分布接估计出总体的分布情况,为此,我们可情况,为此,我们可以先将以上数据按每以先将以上数据按每个数据出现的频数和个数据出现的频数和频率汇成表频率汇成表:从表格中,我们就能估计出总体大致的从表格中,我们就能估计出总体大致的分布情况了,如在分布情况了,如在1665166516661666年之间,英国年之间,英国男性头盖骨宽度主要在男性头盖骨宽度主要在136136149mm149mm之间,之间,135mm135mm以下以及以下以及140mm140mm以上所占的比例相对较以上所占的比例相对较小等小等.但是,这些关于分布情况的描述仍
5、不但是,这些关于分布情况的描述仍不够形象够形象.为了得到更为直观的信息,我们可以将表为了得到更为直观的信息,我们可以将表中的数据按照下面的方式分组,再画频数分中的数据按照下面的方式分组,再画频数分布直方图,用图中矩形的高度来反映频数布直方图,用图中矩形的高度来反映频数.我们也可以用区间上矩形的面积来反映频率我们也可以用区间上矩形的面积来反映频率,得到下图得到下图.图图1-24称为频率分布直方图称为频率分布直方图思考交流思考交流观察此频率分布直方图,你能观察此频率分布直方图,你能知道:知道:(1 1)头盖骨的宽度位于哪个区)头盖骨的宽度位于哪个区间的数据最多?间的数据最多?(2 2)头盖骨的宽度
6、在)头盖骨的宽度在140140145 mm145 mm的频率约是多少?的频率约是多少?(3 3)头盖骨的宽度小于)头盖骨的宽度小于140 mm140 mm的频率约是多少?的频率约是多少?(4 4)头盖骨的宽度在)头盖骨的宽度在137137142 mm142 mm的频率约是多少?的频率约是多少?(1 1)140140145mm145mm的最多的最多(2 2)0.434 0.434(3 3)0.2830.283(4 4)0.2980.298通常通常,在频率分布直方图中,按照分组原则,再在左在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间边和右边各加一个区间.从所加的左边区间的中点开从所
7、加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称边所加区间的中点,就可以得到一条折线,我们称之为之为频率折线图频率折线图.(.(如上图所示如上图所示)变式训练变式训练1 1:我国是世界上严重缺水的国家之一,我国是世界上严重缺水的国家之一,城市缺水问题较为突出城市缺水问题较为突出.某市政府为了节约用水,某市政府为了节约用水,计划在本市试行居民生活用水定额管理条例,即计划在本市试行居民生活用水定额管理条例,即确定一个居民月用水量标准确定一个居民月用水量标准,用水量不超过用水量不超过 的按的按平价
8、收费,超过平价收费,超过 的按议价收费的按议价收费.如果希望大部分如果希望大部分居民的日常生活不受影响,那么标准居民的日常生活不受影响,那么标准 定为多少比定为多少比较理?你认为为了较为合理地确定出这个标准,较理?你认为为了较为合理地确定出这个标准,需要做什么工作?需要做什么工作?根据这些数据你根据这些数据你能得出用水量其能得出用水量其他信息吗他信息吗?由于城市住户较多,通常采用抽样调查的方式,由于城市住户较多,通常采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况通过分析样本数据来估计全市居民用水量的分布情况.假设通过抽样,我们获得了假设通过抽样,我们获得了100100位居民
9、某年的月均用位居民某年的月均用水量水量(单位:单位:t)t):表表21 100位居民的月均用水量位居民的月均用水量 (单位(单位:t )3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7
10、 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 从上面这些数字,我们很容易发现居民从上面这些数字,我们很容易发现居民的月均用水量的最小值是的月均用水量的最小值是0.2t,0.2t,最大值是最大值是4.3t.4.3t.其他在其他在0.20.2至至4.34.3之间之间.很难再发现其很难再发现其他信息他信息.我们很难从随意记录的
11、数据中直接我们很难从随意记录的数据中直接看出规律看出规律.为此,我们需要对统计数据进行为此,我们需要对统计数据进行整理与分析整理与分析.这就用到了我们今天学习的频率分布这就用到了我们今天学习的频率分布直方图直方图.1 1、求极差、求极差(即一组数据中最大值与最小值的差即一组数据中最大值与最小值的差)知道这组数据的变动范围知道这组数据的变动范围4.3-0.2=4.14.3-0.2=4.1(t t).2 2、决定组距与组数(将数据分组)、决定组距与组数(将数据分组)3 3、将数据、将数据分组分组.(8.2.(8.2取整取整,分为分为9 9组组)画频率分布直方图的步骤:画频率分布直方图的步骤:4 4
12、、列出列出频率分布表频率分布表.(学生填写频率学生填写频率/组距一栏组距一栏)5 5、画出画出频率分布直方图频率分布直方图.组距组距:指每个小组的两个端点的距离指每个小组的两个端点的距离.组数:组数:将数据分组,当数据在将数据分组,当数据在100100个以内时,个以内时,按数据多少常分按数据多少常分5-125-12组组.4.18.20.5极差组数=组距注意注意第几组频数(1)第几组频率样本容量(2)(2)纵坐标为纵坐标为:频 率组 距 表表22 100位居民月均用水量的位居民月均用水量的 频率分布表频率分布表 分组分组 频数频数 频率频率 频率频率/组距组距 0,0.5)4 0.04 0.5,
13、1)8 0.08 1,1.5)15 0.15 1.5,2)22 0.22 2,2.5)25 0.25 2.5,3)14 0.14 3,3.5)6 0.06 3.5,4)4 0.04 4,4.5)2 0.02 合计合计 100 1.00 0.08 0.160.3 0.440.50.280.120.080.04频率分布直方图频率分布直方图月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5小长方形的小长方形的面积面积=?月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.5
14、44.5频率分布直方图频率分布直方图各小长方形的面各小长方形的面积总和积总和=?注:小长方形的面积组距注:小长方形的面积组距频率频率/组距频率组距频率 各长方形的面积总和等于各长方形的面积总和等于1.1.频率分布直方图频率分布直方图月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5月均用水量最月均用水量最多的在哪个区多的在哪个区间间?频率分布直方图频率分布直方图月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5直方图有哪些直方图有哪些优点和缺点优点和缺点?
15、例例2为了了解高一年级学生的体能情况,某校抽为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图数据整理后,画出频率分布直方图(如图所示如图所示),图 中 从 左 到 右 各 小 矩 形 的 面 积 之 比 为,图 中 从 左 到 右 各 小 矩 形 的 面 积 之 比 为2 4 17 15 9 3,第二小组的频数为,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?第二小组的频率是多少?样本容量是多少?返返回回(2)若次数在若次数在110以上以上(含含110次次)为达标,则该校全体
16、为达标,则该校全体高一年级学生的达标率约是多少?高一年级学生的达标率约是多少?题目题目变式训练变式训练2如图所示是总体的一个样本频率分布直方如图所示是总体的一个样本频率分布直方图,且在图,且在15,18)内频数为内频数为8.(1)求样本在求样本在15,18)内的频率;内的频率;(2)求样本容量;求样本容量;(3)若在若在12,15)内的小矩形面积为内的小矩形面积为0.06,求在,求在18,33)内内的频数的频数.解由样本频率分布直方图可知组距为3.(2)样本在15,18)内频数为8,(3)在12,15)内的小矩形面积为0.06,样本在12,15)内的频率为0.06,故样本在15,33)内的频数
17、为50(10.06)47,又在15,18)内频数为8,故在18,33)内的频数为47839.根据上图可得这根据上图可得这100100名学生中体重在名学生中体重在56.5,64.556.5,64.5的学生人数的学生人数是是()()A.20 B.30 C.40 D.50A.20 B.30 C.40 D.501 1为了了解某地区高三学生的身体发育情况,抽查了该地为了了解某地区高三学生的身体发育情况,抽查了该地区区100100名年龄为名年龄为17.517.5岁岁1818岁的男生体重岁的男生体重(kg),(kg),得到频率分得到频率分布直方图如下:布直方图如下:C C0.030.050.07体重体重(k
18、g)频率频率/组距组距54.5 58.5 62.5 66.5 70.5 74.5 24002400 27002700 30003000 33003300 36003600 39003900X X 体重体重y y0.0010.0012 2、观察新生婴儿的体重,其频率分布直方图如图所示,、观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重则新生婴儿体重(2700,3000)(2700,3000)的频率为:的频率为:.0.30.31.1.学会用样本的频率分布估计总体学会用样本的频率分布估计总体.2.2.会根据样本数据画出频率分布直方图及频率会根据样本数据画出频率分布直方图及频率分布折线图分布折线图.