1、 2.2 2.2 用样本估计总体用样本估计总体.2.2.2.2用样本的数字特征估计总体的用样本的数字特征估计总体的数字特征数字特征 问题提出问题提出1.1.对一个未知总体,我们常用样本的频率分布估计总体的对一个未知总体,我们常用样本的频率分布估计总体的分布,其中表示样本数据的频率分布的基本方法有哪些?分布,其中表示样本数据的频率分布的基本方法有哪些?2.2.美国美国NBANBA在在2006200720062007年度赛季中,甲、乙两名篮球年度赛季中,甲、乙两名篮球运动员在随机抽取的运动员在随机抽取的1212场比赛中的得分情况如下:场比赛中的得分情况如下:甲运动员得分:甲运动员得分:1212,1
2、515,2020,2525,3131,3131,3636,3636,3737,3939,4444,49.49.乙运动员得分:乙运动员得分:8 8,1313,1414,1616,2323,2626,2828,3838,3939,5151,3131,29.29.如果要求我们根据上面的数据,估计、比较如果要求我们根据上面的数据,估计、比较甲,乙两名运动员哪一位发挥得比较稳定,就得甲,乙两名运动员哪一位发挥得比较稳定,就得有相应的数据作为比较依据,即通过样本数据对有相应的数据作为比较依据,即通过样本数据对总体的数字特征进行研究,用样本的数字特征估总体的数字特征进行研究,用样本的数字特征估计总体的数字特
3、征计总体的数字特征.知识探究(一):众数、中位数和平均数知识探究(一):众数、中位数和平均数 思考思考1 1:在初中我们学过众数、中位数和在初中我们学过众数、中位数和平均数的概念,这些数据都是反映样本平均数的概念,这些数据都是反映样本信息的数字特征,对一组样本数据如何信息的数字特征,对一组样本数据如何求众数、中位数和平均数?求众数、中位数和平均数?思考思考2 2:在城市居民月均用水量样本数据在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在的频率分布直方图中,你认为众数应在哪个小矩形内?由此估计总体的众数是哪个小矩形内?由此估计总体的众数是什么?什么?月均用水量月均用水量/t频率频
4、率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O思考思考3 3:在频率分布直方图中,每个小矩在频率分布直方图中,每个小矩形的面积表示什么?中位数左右两侧的形的面积表示什么?中位数左右两侧的直方图的面积应有什么关系?直方图的面积应有什么关系?取最高矩形下端取最高矩形下端中点的横坐标中点的横坐标2.252.25作为众数作为众数.思考思考4 4:在城市居民月均用水量样本数据的频在城市居民月均用水量样本数据的频率分布直方图中,从左至右各个小矩形的面率分布直方图中,从左
5、至右各个小矩形的面积分别是积分别是0.040.04,0.080.08,0.150.15,0.220.22,0.250.25,0.140.14,0.060.06,0.040.04,0.02.0.02.由此估计总体的由此估计总体的中位数是什么?中位数是什么?月均用水量月均用水量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O O0.5-0.04-0.08-0.15-0.22=0.010.5-0.04-0.08-0.15-0.22=0.01,0.50.50
6、.010.010.25=0.020.25=0.02,中位数是,中位数是2.02.2.02.思考思考5 5:平均数是频率分布直方图的平均数是频率分布直方图的“重心重心”,在城市居民月均用水量样本数据的频率分布在城市居民月均用水量样本数据的频率分布直方图中,各个小矩形的重心在哪里?从直直方图中,各个小矩形的重心在哪里?从直方图估计总体在各组数据内的平均数分别为方图估计总体在各组数据内的平均数分别为多少?多少?0.250.25,0.750.75,1.251.25,1.751.75,2.252.25,2.752.75,3.253.25,3.753.75,4.25.4.25.月均用水量月均用水量/t频率
7、频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O O思考思考6 6:根据统计学中数学期望原理,将频率根据统计学中数学期望原理,将频率分布直方图中每个小矩形的面积与小矩形底分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加,就是样本数据的边中点的横坐标之积相加,就是样本数据的估值平均数估值平均数.由此估计总体的平均数是什么?由此估计总体的平均数是什么?0.250.250.040.04+0.750.750.080.08+1.251.250.150.15
8、+1.751.750.220.22+2.252.250.250.25+2.752.750.140.14+3.253.25 0.060.06+3.753.750.040.04+4.254.250.02=2.020.02=2.02(t t).平均数是平均数是2.02.2.02.平均数与中位数相等,是必然还是巧合?平均数与中位数相等,是必然还是巧合?思考思考7 7:从居民月均用水量样本数据可知,该从居民月均用水量样本数据可知,该样本的众数是样本的众数是2.32.3,中位数是,中位数是2.02.0,平均数是,平均数是1.9731.973,这与我们从样本频率分布直方图得出,这与我们从样本频率分布直方图得
9、出的结论有偏差,你能解释一下原因吗?的结论有偏差,你能解释一下原因吗?注注:在只有样本频率分布直方图的情况下,我在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均们可以按上述方法估计众数、中位数和平均数,并由此估计总体特征数,并由此估计总体特征.思考思考8 8:你怎样理解你怎样理解“我们单位的收入水我们单位的收入水平比别的单位高平比别的单位高”这句话的含义?这句话的含义?思考思考1 1:在一次射击选拔赛中,甲、乙在一次射击选拔赛中,甲、乙两名运动员各射击两名运动员各射击1010次,每次命中的环次,每次命中的环数如下:数如下:甲:甲:7 8 7 9 5 4 9 10 7
10、47 8 7 9 5 4 9 10 7 4乙:乙:9 5 7 8 7 6 8 6 7 79 5 7 8 7 6 8 6 7 7 甲、乙两人本次射击的平均成绩分甲、乙两人本次射击的平均成绩分别为多少环?别为多少环?77乙甲,xx知识探究(二):标准差知识探究(二):标准差 思考思考2 2:甲、乙两人射击的平均成绩相等,观甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布条形图,你能说明其察两人成绩的频率分布条形图,你能说明其水平差异在那里吗?水平差异在那里吗?环数环数频率频率0.40.40.30.30.20.20.10.14 5 6 7 8 9 10 4 5 6 7 8 9 10 O O(甲)
11、(甲)环数环数频率频率0.40.40.30.30.20.20.10.14 5 6 7 8 9 10 4 5 6 7 8 9 10 O O(乙)(乙)甲的成绩比较分散,极差较大,乙的甲的成绩比较分散,极差较大,乙的成绩相对集中,比较稳定成绩相对集中,比较稳定.思考思考3 3:对于样本数据对于样本数据x x1 1,x x2 2,x xn n,设想通过各数据到其平均数的平均距离设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个来反映样本数据的分散程度,那么这个平均距离如何计算?平均距离如何计算?12|nxxxxxxn-+-+-L思考思考4 4:反映样本数据的分散程度的大小,最反映样
12、本数据的分散程度的大小,最常用的统计量是标准差,一般用常用的统计量是标准差,一般用s s表示表示.假设假设样本数据样本数据x x1 1,x x2 2,x xn n的平均数为的平均数为 ,则标,则标准差的计算公式是:准差的计算公式是:22212()()()nxxxxxxsn-+-+-=L 那么标准差的取值范围是什么?标准差为那么标准差的取值范围是什么?标准差为0 0的样本数据有何特点?的样本数据有何特点?s0s0,标准差为,标准差为0 0的样本数据都相等的样本数据都相等.x思考思考5 5:对于一个容量为对于一个容量为2 2的样本:的样本:x x1 1,x x2 2(x(x1 1x x2 2),则
13、,则 ,在数轴上,这两个统计数据有什么几何意义?在数轴上,这两个统计数据有什么几何意义?由此说明标准差的大小对数据的离散程度有由此说明标准差的大小对数据的离散程度有何影响?何影响?122xxx+=212xxs-=标准差越大离散程度越大,数据较分散;标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中标准差越小离散程度越小,数据较集中在平均数周围在平均数周围.知识迁移知识迁移 s s甲甲=2=2,s s乙乙=1.095.=1.095.例例1.计算甲、乙两名运动员的射击成计算甲、乙两名运动员的射击成绩的标准差,比较其射击水平的稳定性绩的标准差,比较其射击水平的稳定性.甲:甲:7
14、8 7 9 5 4 9 10 7 47 8 7 9 5 4 9 10 7 4乙:乙:9 5 7 8 7 6 8 6 7 79 5 7 8 7 6 8 6 7 7例题分析例题分析例例2 2.画出下列四组样本数据的条形图,画出下列四组样本数据的条形图,说明他们的异同点说明他们的异同点.(1)(1),;,;(2)(2),;,;O O频率频率1.00.80.60.40.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 (1)50 xs=O O频率频率1.00.80.60.40.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 (2)50.82xs=(3)(3),;,;(4)
15、(4),.频率频率1.01.00.80.80.60.60.40.40.20.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 O O(3 3)频率频率1.01.00.80.80.60.60.40.40.20.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 O O(4 4)51.49xs=52.83xs=1.1.标准差的平方标准差的平方s s2 2称为方差,有时用方称为方差,有时用方差代替标准差测量样本数据的离散度差代替标准差测量样本数据的离散度.方差与标准差的测量效果是一致的,在方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差实际应用中一般多采用标准差
16、.2.2.现实中的总体所包含的个体数往往现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但差去估计总体的平均数与标准差,但要求样本有较好的代表性要求样本有较好的代表性.知识探究(三):方差知识探究(三):方差 例例3 3.甲、乙两人同时生产内径为甲、乙两人同时生产内径为25.40mm25.40mm的一种的一种零件,为了对两人的生产质量进行评比,从他们零件,为了对两人的生产质量进行评比,从他们生产的零件中各随机抽取生产的零件中各随机抽取2020件,量得其内径
17、尺寸件,量得其内径尺寸如下(单位:如下(单位:mmmm):):甲甲 :25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.3925.44 25.40 25.42 25.35 25.41 25.39乙:乙:25.40 25.43 25.44 25.48
18、 25.48 25.47 25.49 25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 26.36 25.34 25.33 25.43 25.43 25.32 25.49 26.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.3225.47 25.31 25.32 25.32 25.32 25.48 25.48从生产零件内径的尺寸看,谁生产的零件质量较高?从生产零件内径的尺寸看,谁生产的零件质量较高?25.401x甲25.406x乙0.037s甲0.068s乙 甲生产的零件内径
19、更接近内径标准,且稳定甲生产的零件内径更接近内径标准,且稳定程度较高,故甲生产的零件质量较高程度较高,故甲生产的零件质量较高.说明:说明:1.1.生产质量可以从总体的平均数与标准差生产质量可以从总体的平均数与标准差两个角度来衡量,但甲、乙两个总体的平均数与两个角度来衡量,但甲、乙两个总体的平均数与标准差都是不知道的,我们就用样本的平均数与标准差都是不知道的,我们就用样本的平均数与标准差估计总体的平均数与标准差标准差估计总体的平均数与标准差.2.2.问题中问题中25.40mm25.40mm是内径的标准值,而不是是内径的标准值,而不是总体的平均数总体的平均数.例例4 4.在去年的足球甲在去年的足球
20、甲A A联赛中,甲队每场比联赛中,甲队每场比赛平均失球数是赛平均失球数是1.51.5,全年比赛失球个数的标,全年比赛失球个数的标准差为准差为1.11.1;乙队每场比赛平均失球数是;乙队每场比赛平均失球数是2.12.1,全年比赛失球个数的标准差为全年比赛失球个数的标准差为0.4.0.4.你认为下你认为下列说法是否正确,为什么?列说法是否正确,为什么?(1 1)平均来说甲队比乙队防守技术好;平均来说甲队比乙队防守技术好;(2 2)乙队比甲队技术水平更稳定;)乙队比甲队技术水平更稳定;(3 3)甲队有时表现很差,有时表现又非常)甲队有时表现很差,有时表现又非常 好;好;(4 4)乙队很少不失球)乙队
21、很少不失球.例例5 5.以往招生统计显示,某所大学录以往招生统计显示,某所大学录取的新生高考总分的中位数基本稳定在取的新生高考总分的中位数基本稳定在550550分,若某同学今年高考得了分,若某同学今年高考得了520520分,分,他想报考这所大学还需收集哪些信息?他想报考这所大学还需收集哪些信息?要点:(要点:(1 1)查往年录取的新生的平均分数)查往年录取的新生的平均分数.若平均数小于中位数很多,说明最低录取若平均数小于中位数很多,说明最低录取线较低,可以报考;线较低,可以报考;(2 2)查往年录取的新生高考总分的标准差)查往年录取的新生高考总分的标准差.若标准差较大,说明新生的录取分数较分若
22、标准差较大,说明新生的录取分数较分散,最低录取线可能较低,可以考虑报考散,最低录取线可能较低,可以考虑报考.例例6 6.有有2020种不同的零食,它们的热量种不同的零食,它们的热量含量如下:含量如下:110 120 123 165 432 190 110 120 123 165 432 190 174 235 428 318 249 280 174 235 428 318 249 280 162 146 210 120 123 120 162 146 210 120 123 120 150 140150 140(1 1)以上)以上2020个数据组成总体,求总体平个数据组成总体,求总体平均数与总
23、体标准差;均数与总体标准差;(2 2)设计一个适当的随机抽样方法,从)设计一个适当的随机抽样方法,从总体中抽取一个容量为总体中抽取一个容量为7 7的样本,计算样的样本,计算样本的平均数和标准差本的平均数和标准差.(1 1)总体平均数为)总体平均数为199.75199.75,总体标准,总体标准差为差为95.26.95.26.(1 1)以上)以上2020个数据组成总体,求总体平均个数据组成总体,求总体平均数与总体标准差;数与总体标准差;(2 2)设计一个适当的随机抽样方法,从总)设计一个适当的随机抽样方法,从总体中抽取一个容量为体中抽取一个容量为7 7的样本,计算样本的的样本,计算样本的平均数和标准差平均数和标准差.(2 2)可以用抽签法抽取样本,样本的)可以用抽签法抽取样本,样本的平均数和标准差与抽取的样本有关平均数和标准差与抽取的样本有关.