1、2.2.1 2.2.1 用样本的频率分用样本的频率分 布估计总体分布布估计总体分布 频率分布频率分布 样本中所有数据(或数据组)的样本中所有数据(或数据组)的频数频数和和 样本容量的比样本容量的比,叫做该数据的,叫做该数据的频率频率。 频率分布的表示形式有:频率分布的表示形式有: 样本频率样本频率分布表分布表 样本频率分布图样本频率分布图 样本频率分布样本频率分布条形图条形图 样本频率分布样本频率分布直方图直方图 样本频率分布样本频率分布折线图折线图 所有数据(或数据组)的频数的分布所有数据(或数据组)的频数的分布 变化规律叫做变化规律叫做样本的频率分布。样本的频率分布。 1 1、抛掷硬币的大
2、量重复试验的结果:、抛掷硬币的大量重复试验的结果: 35 964 反面向上反面向上 36 124 正面向上正面向上 频率频率 频数频数 实验结果实验结果 0.501 1 0.498 9 频率分布条形图频率分布条形图 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0 1 试验结果试验结果 频率频率 “正面向上”记“正面向上”记 为为0 “反面向上”记为“反面向上”记为1 频率分布表频率分布表: 注意:注意: 各长方形长条的宽度要相同各长方形长条的宽度要相同。 相邻长条的间距要适当。相邻长条的间距要适当。 结论:当试验次数结论:当试验次数 无限增大时,两种试验无限增大时,两种试验 结果的
3、频率大致相等。结果的频率大致相等。 长方形长条的高度长方形长条的高度 表示取各值的频率表示取各值的频率。 例例1. 为检测某种产品的质量为检测某种产品的质量,抽取了一个容量为抽取了一个容量为30的样本的样本, 检测结果为一级品检测结果为一级品5件件,二级品二级品8件件,三级品三级品13件件,次品次品4件件 (1) 列出样本的列出样本的频率分布表频率分布表; (2) 画出表示样本频率分布的画出表示样本频率分布的条形图条形图; (3)(3)根据上述结果,估计此种产品为二级品或三级品的根据上述结果,估计此种产品为二级品或三级品的概率概率 约是多少约是多少 解:解: (1)样本的频率分布表为:)样本的
4、频率分布表为: 0.13 4 次品次品 0.43 13 三级品三级品 0.27 8 二级品二级品 0.17 5 一级品一级品 频率频率 频数频数 产品产品 解:解: (2)样本频率分布)样本频率分布 的的条形图条形图为:为: 0.1 0.2 0.3 0.4 0.5 0.6 0.7 一级品一级品 二级品二级品 产品产品 频率频率 三级品三级品 次品次品 (3)此种产品为二级品或三级品的此种产品为二级品或三级品的概率概率约为约为 0.270.430.7 知识探究(一):频率分布表知识探究(一):频率分布表 【问题问题】 我国是世界上严重缺水的国家我国是世界上严重缺水的国家 之一,城市缺水问题较为突
5、出,某市政府之一,城市缺水问题较为突出,某市政府 为了节约生活用水,计划在本市试行居民为了节约生活用水,计划在本市试行居民 生活用水定额管理,即确定一个居民月生活用水定额管理,即确定一个居民月用用 水量标准水量标准a a,用水量,用水量不超过不超过a a的部分按平价的部分按平价 收费,收费,超出超出a a的部分按议价收费的部分按议价收费. .通过抽样通过抽样 调查,获得调查,获得100100位居民位居民20132013年的月均用水量年的月均用水量 如下表(单位:如下表(单位:t t):): 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.1 2.5 2.0 2
6、.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 3.4 2.6 2.2 2.2 1.5 1.2 0.20.2 0.4 0.3 0.40.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 3
7、.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.34.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.03.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1
8、.0 1.0 1.7 0.8 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.22.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 显然:这个例子与前面抛掷硬币的问题是不同的,这显然:这个例子与前面抛掷硬币的问题是不同的,这 里的总体可以在一个实数区间取值,称为里的总体可以在一个实数区间取值,称为连续型总体连续型总体。 样本的频率分布表示形式有:样本的频率分布表示形式有: 频率分布表频率分布表和和频率分布直方图频率分布直方图 1.1.极差:极差:样本数据
9、中的样本数据中的最大值最大值和和最小最小 值的差值的差称为极差称为极差 2.2.确定组距,组数:确定组距,组数:. .如果将上述如果将上述 100100个数据按组距为个数据按组距为0.50.5进行分组,进行分组, 那么这些数据共分为多少组?那么这些数据共分为多少组? 0.20.24.34.3 (4.34.3- -0.20.2)0.5=8.20.5=8.2 画频率分布直方图的步骤画频率分布直方图的步骤 3 3 将数据分组,决定分点:将数据分组,决定分点:以组距为以组距为 0.50.5进行分组,上述进行分组,上述100100个数据共分为个数据共分为9 9组,组, 各组数据的取值范围可以如何设定?各
10、组数据的取值范围可以如何设定? 4 4 画频率分布表:画频率分布表:如何统计上述如何统计上述100100个数个数 据在各组中的频数?如何计算样本数据据在各组中的频数?如何计算样本数据 在各组中的频率?你能将这些数据用表在各组中的频率?你能将这些数据用表 格反映出来吗?格反映出来吗? 00,0.50.5),),0.50.5,1 1),),11,1.51.5),), ,44,4.5.4.5. 分分 组组 频数累计频数累计 频数频数 频率频率 00,0.50.5) 4 0.044 0.04 0.50.5,1 1) 正正 8 0.088 0.08 11,1.51.5) 正正 正正 正正 15 0.15
11、15 0.15 1.51.5,2 2) 正正 正正 正正 正正 22 0.2222 0.22 22,2.52.5) 正正 正正 正正 正正 正正 25 0.2525 0.25 2.52.5,3 3) 正正 正正 14 0.1414 0.14 33,3.53.5) 正正 一一 6 0.066 0.06 3.53.5,4 4) 4 0.044 0.04 44,4.5 2 0.024.5 2 0.02 合计合计 100 1.00100 1.00 知识探究(二):频率分布直方图知识探究(二):频率分布直方图 5 5 画频率分布直方图画频率分布直方图 为了直观反映样本为了直观反映样本 数据在各组中的分布
12、情况,我们数据在各组中的分布情况,我们将上述将上述 频率分布表中频率分布表中的有关信息用下面的图形的有关信息用下面的图形 表示:表示: 月均用水量月均用水量/t 频率频率 组距组距 0 0. .5 5 0 0. .4 4 0 0. .3 3 0 0. .2 2 0 0. .1 1 0 0. .5 5 1 1 1 1. .5 5 2 2 2 2. .5 5 3 3 3 3. .5 5 4 4 4 4. .5 5 O 上图称为上图称为频率分布直方图频率分布直方图,其中,其中横轴横轴 表示月均用水量,表示月均用水量,纵轴纵轴表示频率表示频率/ /组距组距. . 频率分布直方图中频率分布直方图中各小长
13、方形的宽度各小长方形的宽度 和高度和高度在在数量上有何特点数量上有何特点? 月均用水量月均用水量/t 频率频率 组距组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O 宽度:宽度:组距组距 高度:高度: 频率频率 组距组距 2 图形的意义图形的意义 图形的意义:图形的意义:频率分布直方图中频率分布直方图中各小长各小长 方形的面积方形的面积表示什么?表示什么?各小长方形的面各小长方形的面 积之和为积之和为多少?多少? 各小长方形的面积各小长方形的面积= =频率频率 各小长方形的面积之和各小长方形的面积之和= =1 1 月均用水量月均用水量/t
14、 频率频率 组距组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O 宽度:宽度:组距组距 高度:高度: 频率频率 组距组距 频率分布的条形图和频率分布直方图的区别频率分布的条形图和频率分布直方图的区别 两者是不同的概念;两者是不同的概念; 横轴:两者表示内容横轴:两者表示内容相同相同 思考:思考: 频率分布条形图和频率分布直方图是两个频率分布条形图和频率分布直方图是两个 相同的概念吗?相同的概念吗? 有什么区别?有什么区别? 纵轴:两者表示的内容纵轴:两者表示的内容不相同不相同 频率分布条形图频率分布条形图的纵轴(长方形的高)的纵轴(长方形
15、的高)表示频率表示频率 频率分布直方图频率分布直方图的纵轴(长方形的高)的纵轴(长方形的高)表示表示 频率与组距的比值,频率与组距的比值, 其相应组距上的频率等于该组距上长方形的面积。其相应组距上的频率等于该组距上长方形的面积。 = 频率 长方形的面积组距频率 组距 3 3 分析例题:分析例题:频率分布直方图非常直观频率分布直方图非常直观 地表明了样本数据的分布情况,使我们地表明了样本数据的分布情况,使我们 能够看到频率分布表中看不太清楚的数能够看到频率分布表中看不太清楚的数 据模式据模式,但,但原始数据不能在图中表示原始数据不能在图中表示出出 来来. .你能根据上述频率分布直方图指出居你能根
16、据上述频率分布直方图指出居 民月均用水量的一些数据特点吗?民月均用水量的一些数据特点吗? 月均用水量月均用水量/t 频率频率 组距组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O (1 1)居民月均用水量的分布是)居民月均用水量的分布是“山峰山峰”状的,而状的,而 且是且是“单峰单峰”的;的; (2 2)大部分居民的月均用水量集中在一个中间值)大部分居民的月均用水量集中在一个中间值 附近,只有少数居民的月均用水量很多或很少;附近,只有少数居民的月均用水量很多或很少; (3 3)居民月均用水量的分布有一定的对称性等)居民月均用水量的分布有一
17、定的对称性等. . 月均用水量月均用水量/t 频率频率 组距组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O 频率分布直方图如下频率分布直方图如下: 月均用水量月均用水量 /t 频率频率 组距组距 0.10 0.20 0.30 0.40 0.50 0.5 1 1.5 2 2.5 3 3.5 4 4.5 连接频率分布直方图连接频率分布直方图 中各小长方形上端的中各小长方形上端的 中点中点,得到得到频率分布折频率分布折 线图线图 利用样本频分布对总体分布进行相应估计利用样本频分布对总体分布进行相应估计 (2)样本容量越大样本容量越大,这种估计
18、越精确这种估计越精确。 (1)上例的样本容量为上例的样本容量为100,如果增至如果增至1000, 其频率分布直方图的情况会有什么变化其频率分布直方图的情况会有什么变化?假如增假如增 至至10000呢呢? 总体密度曲线总体密度曲线 频率频率 组距组距 月均用月均用 水量水量/t a b (图中阴影部分的面积,表示总体在(图中阴影部分的面积,表示总体在 某个区间某个区间 (a, b) 内取值的百分比)。内取值的百分比)。 当样本容量无限增大,分组的组距无限缩小,那么当样本容量无限增大,分组的组距无限缩小,那么 频率分布折线图就会无限接近一条光滑曲线频率分布折线图就会无限接近一条光滑曲线总体密总体密
19、 度曲线度曲线 总体密度曲线总体密度曲线 用样本分布直方图去估计相应的总体分布时用样本分布直方图去估计相应的总体分布时, 一般样本容量越大一般样本容量越大,频率分布直方图频率分布直方图就会无限接就会无限接 近近总体密度曲线总体密度曲线,就越精确地反映了总体的分布就越精确地反映了总体的分布 规律规律,即越精确地反映了总体在各个范围内取值即越精确地反映了总体在各个范围内取值 百分比百分比。 总体密度曲线反映了总体在各个范围内取值的总体密度曲线反映了总体在各个范围内取值的 百分比百分比,精确地反映了总体的分布规律精确地反映了总体的分布规律。是研究总是研究总 体分布的工具体分布的工具. 总体密度曲线总
20、体密度曲线 1、求极差、求极差(即一组数据中最大值与最小值的差即一组数据中最大值与最小值的差) 知道这组数据的变动范围知道这组数据的变动范围4.3-0.2=4.1 2、决定组距与组数(将数据分组)、决定组距与组数(将数据分组) 3、 将数据分组将数据分组(8.2取整取整,分为分为9组组) 画频率分布直方图的步骤画频率分布直方图的步骤 4、列出、列出频率分布表频率分布表.(填写频率填写频率/组距一栏组距一栏) 5、画出、画出频率分布直方图频率分布直方图。 组距组距:指每个小组的两个端点的距离,组距指每个小组的两个端点的距离,组距 组数组数:将数据分组,当数据在将数据分组,当数据在100个以内时,
21、个以内时, 按数据多少常分按数据多少常分5-12组。组。 4.1 8.2 0.5 极极差差 组组数数= = 组组距距 小结小结 1 1、一个容量为、一个容量为2020的样本数据的样本数据. .分组后分组后. .组距与频组距与频 数如下:数如下:(0,20 2;(20,30 3, (30,40 4; (0,20 2;(20,30 3, (30,40 4; (40,50 5; (50,60 4; (60,70 2(40,50 5; (50,60 4; (60,70 2。则样。则样 本在本在( (,50,50上的频率为:上的频率为: , 7/10 (2002,江西) 2为了了解某地区高三学生的身体发
22、育情况,抽为了了解某地区高三学生的身体发育情况,抽 查了该地区查了该地区100名年龄为名年龄为17.5岁岁18岁的男生体重岁的男生体重 (kg) ,得到频率分布直方图如下:得到频率分布直方图如下: C 0.03 0.05 0.07 体重体重(kg) 频率频率/组距组距 54.5 58.5 62.5 66.5 70.5 74.5 根据上图可得这根据上图可得这100名学生中体重在名学生中体重在56.5,64.5 的学生人数是的学生人数是( ) A. 20 B. 30 C. 40 D. 50 2400 2700 3000 3300 3600 3900 X 体重体重 y 0.001 3 3、观察新生婴
23、儿的体重,其频率分布直方图、观察新生婴儿的体重,其频率分布直方图 如图所示,则新生婴儿体重如图所示,则新生婴儿体重(2700,3000)(2700,3000)的频的频 率为:率为: ; 0.3 4.为了了解小学生的体能情况为了了解小学生的体能情况,抽取了某小学同年级部分抽取了某小学同年级部分 学生进行跳绳测试学生进行跳绳测试,将所得数据整理后将所得数据整理后,画出频率分布直画出频率分布直 方图如图方图如图,已知图中从左到右前三个小组的频率分别是已知图中从左到右前三个小组的频率分别是 0.1,0.3,0.4,第一小组的频数为第一小组的频数为5. (1)求第四小组的频率;求第四小组的频率; (2)
24、问参加这次测试的学生人数是多少?问参加这次测试的学生人数是多少? (3)问在这次测试中,学生跳绳次数的中位数落在第几小问在这次测试中,学生跳绳次数的中位数落在第几小 组内?组内? 【解解】 (1)第四小组的频率第四小组的频率1(0.10.30.4) 0.2. (2)n第一小组的频数第一小组的频数第一小组的频率第一小组的频率50.1 50. (3)因为因为0.1505,0.35015,0.45020,0.250 10. 即第一即第一、第二第二、第三第三、第四小组的频数分别为第四小组的频数分别为 5,15,20,10. 所以学生跳绳次数的中位数落在第三小组内所以学生跳绳次数的中位数落在第三小组内
25、解本题的关键是准确掌握频率、频数、样本容量解本题的关键是准确掌握频率、频数、样本容量(数据总数数据总数) 之间的关系及中位数的概念之间的关系及中位数的概念 变式训练变式训练 为了了解高一学生的体能情况为了了解高一学生的体能情况,某校抽某校抽 取部分学生进行一分钟跳绳次数测试取部分学生进行一分钟跳绳次数测试,将所得数据整将所得数据整 理后理后,绘制出频率分布直方图绘制出频率分布直方图(如图所示如图所示),图中从左到图中从左到 右各小矩形的面积之比为右各小矩形的面积之比为241715102,第二第二 小组频数为小组频数为12. 1)第二小组的频率是多少?第二小组的频率是多少? 样本容量是多少?样本
26、容量是多少? (2)若次数在若次数在110以上以上(含含110次次) 为达标,试估计该校全体高一为达标,试估计该校全体高一 学生的达标率是多少?学生的达标率是多少? 解解:(1)第二小组的频率是第二小组的频率是 100.0080.08, 样本容量是样本容量是120.08150. (2)达标率为达标率为(0.0340.0300.020 0.004)10 0.0881088%. 频频率分布表、频率分布直方图和折线图率分布表、频率分布直方图和折线图 的主要作用的主要作用是表示样本数据的分布情况,此是表示样本数据的分布情况,此 外,我们还可以用外,我们还可以用茎叶图来表示茎叶图来表示样本数据的样本数据
27、的 分布情况分布情况. 一般地, 画出一组样本数据的一般地, 画出一组样本数据的茎叶图的步骤茎叶图的步骤如如 何?何? 第一步第一步,将每个数据分为将每个数据分为“茎茎”(高位)和(高位)和“叶叶” (低位)两部分;(低位)两部分; 第二步,第二步, 将将最小的茎最小的茎和和最大的茎之间的数最大的茎之间的数按按大大 小次序排成一列小次序排成一列,写在左(右)侧;,写在左(右)侧; 第三步第三步, 将各个数据的将各个数据的叶按大小次序叶按大小次序写在写在茎右茎右 (左)侧(左)侧. 对于样本数据:对于样本数据:3.1,2.5,2.0,0.8,1.5,1.0, 4.3,2.7,3.1,3.5,用茎
28、叶图如何表示?,用茎叶图如何表示? 0 1 2 3 4 8 0 5 0 5 7 1 1 5 3 茎茎 叶叶 你能理解这个图是如何记录这些数据的吗?你能理解这个图是如何记录这些数据的吗? 你能通过该图说明哪个运动员的发挥更稳定你能通过该图说明哪个运动员的发挥更稳定 吗?吗? 甲甲运动员得分:运动员得分:13,51,23,8,26,38,16, 33,14,28,39; 乙乙运动员得分:运动员得分:49,24,12,31,50,31,44, 36,15,37,25,36,39. 甲甲 乙乙 8 4 6 3 3 6 8 3 8 9 1 0 1 2 3 4 5 5 4 1 6 1 6 7 9 4 9
29、0 2 5 用用茎叶图茎叶图表示数据的分布情况是一种好方法,表示数据的分布情况是一种好方法, 你认为茎叶图有哪些你认为茎叶图有哪些优点优点? (1)保留了原始数据,没有损失样本信息;)保留了原始数据,没有损失样本信息; (2)数据可以随时记录、添加或修改)数据可以随时记录、添加或修改. 当样本数据较少时,用茎叶图表示数据的效果较好当样本数据较少时,用茎叶图表示数据的效果较好 练习:练习:某中学高一(某中学高一(2)班甲,乙两)班甲,乙两 名同学自高中以来每场数学考试成名同学自高中以来每场数学考试成 绩情况如下:绩情况如下: 甲的得分:甲的得分:95,81,75,91,86, 89,71,65,
30、76,88,94 乙的得分:乙的得分:83,86,93,99,88, 96,98,98,79,85,97 画出两人数学成绩茎叶图,请根据画出两人数学成绩茎叶图,请根据 茎叶图对两人的成绩进行比较。茎叶图对两人的成绩进行比较。 表示样本分布的方法表示样本分布的方法: (1)频率分布表)频率分布表优点优点是在数量表示上比较确切,是在数量表示上比较确切,缺点缺点 是不够直观、形象,分析数据分布的总体态势不太方便是不够直观、形象,分析数据分布的总体态势不太方便 (2)频率分布图)频率分布图(包括直方图和条形图)(包括直方图和条形图) 优点优点:易表示:易表示大量数据大量数据 ,直观直观地表明分布地地表
31、明分布地 情况情况 ; 缺点:缺点:丢失一些信息。丢失一些信息。 (3)频率分布折线图)频率分布折线图优点是它反映了数据的变化趋优点是它反映了数据的变化趋 势势 (4)茎叶图)茎叶图优点优点:(1)保留了原始数据,没有损失样)保留了原始数据,没有损失样 本信息;(本信息;(2)数据可以随时记录、添加或修改)数据可以随时记录、添加或修改.缺点:缺点:只能只能 处理样本容量较小数据处理样本容量较小数据 小结小结 1.频率分布表频率分布表 表示样本的分布的方法:表示样本的分布的方法: 分组分组 个数累计个数累计 频数频数 频率频率 频率频率/组距组距 产品尺寸产品尺寸(mm) 2.频率分布直方图频率分布直方图 样本频率分布中,样本频率分布中, 当样本容量无限增当样本容量无限增 大,组距无限缩小大,组距无限缩小 4.样本频率分布直方图样本频率分布直方图接接 近于一条光滑曲线近于一条光滑曲线总总 体密度曲线体密度曲线,反映了总体,反映了总体 分布。分布。 3.频率分布折线图频率分布折线图 5.茎叶图茎叶图