1、1.5.2 估计总体的数字特征下图是某赛季东、西部球队数据,那么如何比较东下图是某赛季东、西部球队数据,那么如何比较东部赛区与西部赛区的优劣呢?部赛区与西部赛区的优劣呢?如果要求我们根据上面的数据,估计、比较某赛季如果要求我们根据上面的数据,估计、比较某赛季东部赛区与西部赛区的优劣,就得有相应的数据作东部赛区与西部赛区的优劣,就得有相应的数据作为比较依据,即通过样本数据对总体的数字特征进为比较依据,即通过样本数据对总体的数字特征进行研究,行研究,用样本的数字特征来估计总体的数字特征用样本的数字特征来估计总体的数字特征.1.1.会用样本平均数和标准差估计总体的数字特征会用样本平均数和标准差估计总
2、体的数字特征.(重点)(重点)2.2.根据数字特征分析、比较总体差异根据数字特征分析、比较总体差异.(难点)(难点)在在19961996年美国亚特兰大奥运会上,中国香港风帆选年美国亚特兰大奥运会上,中国香港风帆选手李丽珊,以惊人的耐力和斗志,勇夺奥运金牌,手李丽珊,以惊人的耐力和斗志,勇夺奥运金牌,为香港体育史揭开了为香港体育史揭开了“突破零突破零”的新一页的新一页.在风帆比在风帆比赛中,成绩以低分为优胜赛中,成绩以低分为优胜.比赛共比赛共1111场,并以最佳的场,并以最佳的9 9场成绩计算最终的名次场成绩计算最终的名次.前前7 7场比赛结束后,排名前场比赛结束后,排名前5 5位的选手积分如表
3、所示:位的选手积分如表所示:排名排名运动员运动员根据上面的比赛结果,我们如何比较各选手之间的根据上面的比赛结果,我们如何比较各选手之间的成绩及稳定情况呢成绩及稳定情况呢?如果此时让你预测谁将获得最如果此时让你预测谁将获得最后的胜利,你会怎么看?后的胜利,你会怎么看?由上表,我们可以分别计算由上表,我们可以分别计算5 5位选手前位选手前7 7场比赛积分场比赛积分的平均数和标准差,分别作为量度各选手比赛的成的平均数和标准差,分别作为量度各选手比赛的成绩及稳定情况的依据,结果如表所示绩及稳定情况的依据,结果如表所示.排名排名运动员运动员平均积分平均积分积分标准差积分标准差1 1李丽珊李丽珊2 2简度
4、简度3 3贺根贺根4 4威尔逊威尔逊5 5李科李科3.143.144.574.575.005.006.296.296.576.571.731.732.772.772.512.513.193.193.333.33 从表中可以看出:李丽珊的平均积分及积分标从表中可以看出:李丽珊的平均积分及积分标准差都比其他选手小,也就是说,在前准差都比其他选手小,也就是说,在前7 7场的比赛过场的比赛过程中,她的成绩最为优异,而且表现也最为稳定程中,她的成绩最为优异,而且表现也最为稳定.于是我们假设之后的比赛中,他们都发挥正常,于是我们假设之后的比赛中,他们都发挥正常,夺冠希望最大的就是李丽珊夺冠希望最大的就是李
5、丽珊.当然,事实也进一步验当然,事实也进一步验证了我们的预测,李丽珊正是凭着自己优异而稳定证了我们的预测,李丽珊正是凭着自己优异而稳定的表现,成为香港首位奥运会金牌得主的的表现,成为香港首位奥运会金牌得主的.【抽象概括抽象概括】用样本估计总体时,如果抽样的方法比较合理,用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信那么样本可以反映总体的信息,但从样本得到的信息会有偏差,这一现象是由抽样的随机性引起的,息会有偏差,这一现象是由抽样的随机性引起的,如果抽样方案没有问题的话,那么这些结论之所以如果抽样方案没有问题的话,那么这些结论之所以不同,其原因就在于样本的
6、随机性,在随机抽样中,不同,其原因就在于样本的随机性,在随机抽样中,这种偏差是不可避免的这种偏差是不可避免的.虽然我们从样本数据得到的分布、平均数和标虽然我们从样本数据得到的分布、平均数和标准差并不是总体真正的分布、平均数和标准差,而准差并不是总体真正的分布、平均数和标准差,而只是总体的一个估计,但这种估计是合理的,特别只是总体的一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息是当样本量很大时,它们确实反映了总体的信息.思考思考1.1.在统计量中在统计量中,刻画数据集中趋势最常用的量是刻画数据集中趋势最常用的量是什么什么?提示提示:平均数描述了数据的平均水平平均数描
7、述了数据的平均水平,定量地反映了数定量地反映了数据集中趋势所处的水平据集中趋势所处的水平,是刻画一组数据集中趋势最是刻画一组数据集中趋势最常用的统计量常用的统计量.思考思考2.2.如何求得总体的平均数与标准差呢如何求得总体的平均数与标准差呢?提示提示:通常的做法是用样本的平均数与标准差去估计通常的做法是用样本的平均数与标准差去估计总体的平均数与标准差总体的平均数与标准差,这与前面用样本的频率分布这与前面用样本的频率分布来近似地代替总体的分布类似来近似地代替总体的分布类似,只要样本的代表性好只要样本的代表性好,这样做就是合理的这样做就是合理的,也是可以接受的也是可以接受的.1.1.有一组数据为有
8、一组数据为1,2,3,4,5,1,2,3,4,5,则其平均数为则其平均数为_,_,标准差为标准差为_._.2.2.从某项综合能力测试中抽取从某项综合能力测试中抽取100100人的成绩,人的成绩,统计如表,则这统计如表,则这100100人成绩的标准差为人成绩的标准差为()分数分数5 54 43 32 21 1人数人数202010103030303010102 108A.3 B.C.3 D.553 32B B3.3.抽样统计甲、乙两位射击运动员的抽样统计甲、乙两位射击运动员的5 5次训练成绩次训练成绩(单位:环),结果如下:(单位:环),结果如下:运动员运动员第第1 1次次第第2 2次次第第3 3
9、次次第第4 4次次第第5 5次次甲甲87879191909089899393乙乙89899090919188889292则成绩较为稳定(方差较小)的那位运动员成绩的则成绩较为稳定(方差较小)的那位运动员成绩的方差为方差为_.2 24 4.某学员在一次射击测试中射靶某学员在一次射击测试中射靶1010次,命中环数如下:次,命中环数如下:7 7,8 8,7 7,9 9,5 5,4 4,9 9,1010,7 7,4 4则(则(1 1)平均命中环数为)平均命中环数为 ;(2 2)命中环数的标准差为)命中环数的标准差为 .7 72 25.5.甲乙两人同时生产内径为甲乙两人同时生产内径为25.40 mm25
10、.40 mm的一种零件的一种零件.为为了对两人的生产质量进行评比了对两人的生产质量进行评比,从他们生产的零件中从他们生产的零件中各抽出各抽出2020件件,量得其内径尺寸如下量得其内径尺寸如下(单位单位:mm):mm)甲甲 25.46,25.32,25.45,25.39,25.36 25.46,25.32,25.45,25.39,25.36 25.34,25.42,25.45,25.38,25.42 25.34,25.42,25.45,25.38,25.42 25.39,25.43,25.39,25.40,25.44 25.39,25.43,25.39,25.40,25.44 25.40,25.
11、42,25.35,25.41,25.39 25.40,25.42,25.35,25.41,25.39乙乙 25.40,25.43,25.44,25.48,25.4825.40,25.43,25.44,25.48,25.48 25.47,25.49,25.49,25.36,25.34 25.47,25.49,25.49,25.36,25.34 25.33,25.43,25.43,25.32,25.47 25.33,25.43,25.43,25.32,25.47 25.31,25.32,25.32,25.32,25.48 25.31,25.32,25.32,25.32,25.48 从生产的零件内径
12、的尺寸看从生产的零件内径的尺寸看,谁生产的质量较高谁生产的质量较高?解解:用计算器计算可得用计算器计算可得:从样本平均数看从样本平均数看,甲生产的零件内径比乙生产甲生产的零件内径比乙生产的更接近内径标准的更接近内径标准(25.40mm),(25.40mm),但是差异很小但是差异很小;从样从样本标准差看本标准差看,由于由于 ,因此甲生产的零件内因此甲生产的零件内径比乙生产的稳定程度高得多,于是可以作出判断,径比乙生产的稳定程度高得多,于是可以作出判断,甲生产的零件的质量比乙的高一些甲生产的零件的质量比乙的高一些.ss甲乙25.400 5,25.405 5,s0.037,s0.068,-=xx甲乙甲乙估计总体的数字特征估计总体的数字特征平均值平均值标准差标准差 地球上一切美丽的东西都来源于太阳,而一切美好的东西都来源于人.普朗克