1、9.2.4总体离散程度的估计新课导语平均数、中位数和众数为我们提供了一组数据的集中趋势的信息,这是概括一组数据的特征的有效方法.但仅知道集中趋势的信息,很多时候还不能使我们做出有效决策.这节课我们共同来研究总体离散趋势的有关知识.新课引入引例:引例:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲:78795491074乙:9578768677如果你是教练,你应当如何对这次射击作出评价?问题问题1:甲、乙两人本次射击成绩的平均数、中位数、众数分别为多少环?问题问题2:观察下图中两人成绩的频率分布条形图,你能说明其水平差异在哪里吗?甲成绩比较分散,乙成绩相对集中.都是7如何度
2、量如何度量这种差异这种差异呢?呢?相关概念极差:极差:极差在一定程度上刻画了数据的离散程度极差在一定程度上刻画了数据的离散程度. . 甲命中环数的极差=10-4=6 乙命中环数的极差=9-5=4 极差只使用了数据中最大、最小两个值的信息,对其他数据的取值情况没有涉及,所以极差所含的信息量很少.思考:你还能想出其他刻画数据离散程度的办法吗? 我们知道,如果射击的成绩很稳定,那么大多数的射击成绩离平均成绩不会太远;相反,如果射击的成绩波动幅度很大,那么大多数的射击成绩离平均成绩会比较远.因此,我们可以通过这两组射击成绩与它们的平均成绩的“平均距离”来度量成绩的波动幅度.思考:如何定义“平均距离”?
3、相关概念为了避免式子中含有绝对值,通常改为平方来代替为了避免式子中含有绝对值,通常改为平方来代替方差:为了单位统一,对方差开平方为了单位统一,对方差开平方标准差:相关概念2.如果总体中所有个体的变量值分别为Y1,Y2,YN,总体平均数为 ,则称S2 为总体方差,S 为总体标准差.如果总体的N个变量值中,不同的值共有k(kN)个,不妨记为Y1,Y2,Yk,其中Yi出现的频数为fi(i1,2,k),则总体方差为S2 .3.如果一个样本中个体的变量值分别为y1,y2,yn,样本平均数为 ,则称s2 为样本方差,S 为样本标准差.方法总结 标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程
4、度越大;标准差越小,数据的离散程度越小.显然,在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差. 在实际问题中,总体平均数和总体标准差都是未知的.就像用样本平均数估计总体平均数一样,通常我们也用样本标准差去估计总体标准差.在随机抽样中,样本标准差依赖于样本的选取,具有随机性.新课引入引例:引例:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲:78795491074乙:9578768677如果你是教练,你应当如何对这次射击作出评价?问题问题3:甲、乙两人射击谁比较稳定? 甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩
5、稳定. 如果要从这两名选手中选择一名参加比赛,要看一下他们的平均成绩在所有参赛选手中的位置.如果两人都排在前面,就选成绩稳定的乙选手,否则可以选甲.例题讲解例例1 1:不经过计算,你能给下列各组数的标准差排序吗?(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.思考:思考:标准差的取值范围是什么? 标准差为0的一组数据有什么特点?例题讲解例2:甲、乙两台机床同时生产一种零件,在10天中,两台机床每天生产的次品数分别为:甲 0 1 0 2 2 0 3 1 2 4乙 2 3 1 1
6、 0 2 1 1 0 1分别计算这两组数据的平均数和标准差,从计算结果看,哪台机床的性能更好?总结:总结:在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度.在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中,越稳定.巩固练习练习1:甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.(1)分别求出两人得分的平均数与方差;(2)根据图形和(1)中计算结果,对两人的训练成绩作出评价.解:(1)由题图可得,甲、乙两人五次测试的成绩分别为甲:10,13,12,14,16;乙:13,14,12,12,14
7、.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.巩固练习练习练习2:甲、乙、丙三名学生在一项集训中的40次测试分数都在50,100内,将他们的测试分数分别绘制成频率分布直方图,如图所示,记甲、乙、丙的分数标准差分别为s1,s2,s3,则它们的大小关系为A.s1s2s3 B.s1s3s2 C.s3s1s2 D.s3s2s1解:比较三个频率分布直方图知,甲为“双峰”直方图,两端数据最多,最分散,方差最大;乙为“单峰”直方图,数据最集中,方差最小;丙为“单峰”直方图,但数据分布相对均匀,方差介于甲、乙之间.综上可知s1s3s2.例题讲解例例3
8、 3:在对树人中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62.你能由这些数据计算出总样本的方差,并对高一年级全体学生的身高作出估计吗?根据方差的定义,总样本方差为因此,把已知男生、女生样本平均数和方差的取值代入,可得故总样本的方差为51.486 2,据此估计高一年级全体学生身高的总体方差为51.486 2.方法总结分层随机抽样的方差分层随机抽样的方差课堂小结1.方差、极差的计算与应用.2.分层随机抽样的方差.3.方法归纳:数据统计、数据分析.THANKS!