1、9.2.49.2.4总体离散程度的估计总体离散程度的估计学习目标:1. 结合实例,能用样本估计总体的离散程度参数;2. 会求样本数据的方差、标准差;3. 理解离散程度参数的统计含义.教学重点:方差、标准差的计算方法.教学难点:利用样本的方差、标准差对总体数据进行分析.1. 总体百分位数的估计 一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100p)%的数据大于或等于这个值计算一组n个数据的第p百分位数的步骤第一步第一步: :按从小到大排列原始数据;第二步第二步: :计算i=np%;第三步第三步:若i不是整数,而大于i的比邻整数为j,则第p百分位
2、数为第j项数据; 若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.复习回顾 平均数、中位数和众数为我们提供了一组数据的集中趋势的信息,这是概括一组数据的特征的有效方法,但仅知道集中趋势的信息,很多时候还不能使我们做出有效决策,下面的问题就是一个例子.2. 总体集中趋势的估计复习回顾 众数:众数:最高矩形的最高矩形的中点中点中位数:中位数:中位数左边的直方图面积和右边的直方图中位数左边的直方图面积和右边的直方图面积相等面积相等 平均数:平均数:每个小矩形底边每个小矩形底边中点的横坐标中点的横坐标与小矩形的与小矩形的面积面积的的乘积之和乘积之和 一种简单的度量数据离散程度的方法就是
3、用极差.可以发现甲的成绩波动范围比乙的大.根据甲、乙运动员的10次射击成绩,可以得到 甲命中环数的极差=10-4=6, 乙命中环数的极差=9-5=4. 极差在一定程度上刻画了数据的离散程度.但因为极差只使用了数据中最大、最小两个值的信息,对其他数据的取值情况没有涉及,所以极差所含的信息量很少.思考:你还能想出其他刻画数据离散程度的办法吗?若射击的成绩很稳定,那么大多数的射击成绩离平均成绩不会太远;相反,若射击的成绩波动幅度很大,那么大多数的射击成绩离平均成绩会比较远. 因此,可以通过这两组射击成绩与它们的平均成绩的“平均距离”来度量成绩的波动幅度.思考:你还能想出其他刻画数据离散程度的办法吗?
4、思考:如何定义“平均距离”?为了避免式中含有绝对值,通常改用平方来代替,即为了避免式中含有绝对值,通常改用平方来代替,即11niixxn 211()niinxx 2211()niisxxn 2222121()()() nsxxxxxxn假设一组数据是假设一组数据是 ,用,用 表示这组数据的平均数表示这组数据的平均数。12,nx xxx(1,2, )ixxin用每个数据与平均数的差的绝对值作为用每个数据与平均数的差的绝对值作为“距离距离”,即,即则这组数据到则这组数据到 的的“平均距离平均距离”为为x我们将其定义为这组数据的我们将其定义为这组数据的方差:方差:引入新知引入新知 引入新知引入新知
5、有时为了计算方差的方便,我们还把方差写成以下形式有时为了计算方差的方便,我们还把方差写成以下形式22211niisxxn 由于方差的单位是原始数据的单位的平方,与原始数据不一致。为了使二者单位一致,我们对方差开方,取它的算数平方根,即由于方差的单位是原始数据的单位的平方,与原始数据不一致。为了使二者单位一致,我们对方差开方,取它的算数平方根,即211()niixsxn 我们称其为这组数据的我们称其为这组数据的标准差标准差有时为了计算方差的方便,我们还把方差写成以下形式有时为了计算方差的方便,我们还把方差写成以下形式由于方差的单位是原始数据的单位的平方,由于方差的单位是原始数据的单位的平方,与原
6、始数据不一致。为了使二者单位一致,与原始数据不一致。为了使二者单位一致,我们对方差开方,取它的算数平方根,即我们对方差开方,取它的算数平方根,即我们称其为这组数据的我们称其为这组数据的标准差标准差总体方差和总体标准差总体方差和总体标准差,21NYYY量值分别为若总体中所有个体的变则称总体平均数为 ,Y212)(1NiiYYNS为总体方差,NiiYYNSS122)(1把.称为总体标准差不妨个不同的值共有个变量中若总体的,)(,NkkN), 2 , 1(,21kifYYYYiik出现的频数为其中记为则总体方差为.)(1212kiiiYYfNS样本方差和样本标准差样本方差和样本标准差,21nyyy量
7、值分别为若一个样本中个体的变则称总体平均数为 , y212)(1niiyyns为样本方差,2211()niissyyn把.称为样本标准差引入新知引入新知 例1 在对树人中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62.你能由这些数据计算出总样本的方差,并对高一年级全体学生的身高方差作出估计吗?3已知某省二、三、四线城市数量之比为已知某省二、三、四线城市数量之比为136,2019年年8月月份调查得知该省所有城市房产均价为份调查得知该省
8、所有城市房产均价为1.2万元万元/平方米,方差为平方米,方差为20,二、三、四线城市的房产均价分别为二、三、四线城市的房产均价分别为2.4万元万元/平方米,平方米,1.8万元万元/平平方米,方米,0.8万元万元/平方米,三、四线城市房价的方差分别为平方米,三、四线城市房价的方差分别为10, 8,则二线城市的房价的方差为则二线城市的房价的方差为 118.524、在一次科技知识竞赛中,某学校的两组学生的成绩如下表:在一次科技知识竞赛中,某学校的两组学生的成绩如下表:请根据你所学过的统计知识,判断这两个组在这次竞赛中请根据你所学过的统计知识,判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由的成绩谁
9、优谁劣,并说明理由解:(1) (86786591047)7x甲甲110110 x乙乙 (6778678795)71. 甲、乙两名战士在相同条件下各打靶10次,每次命中的环数分别是: 甲:8,6,7,8,6,5,9,10,4,7; 乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算以上两组数据的平均数;(2)分别求出两组数据的方差;(3)若要从这两人中选一人参加射击比赛,选谁去合适?(4)甲、乙两名战士的成绩在 2s, 2s内有多少?xx(2)由方差公式 ,得2211()niisxxn 22=3=1.2ss甲甲乙乙,(3)又 ,说明甲战士射击情况波动比乙大.22ss甲甲乙乙因此,乙战士比
10、甲战士射击情况稳定. 从成绩的稳定性考虑,应选择乙参加比赛.1. 甲、乙两名战士在相同条件下各打靶10次,每次命中的环数分别是: 甲:8,6,7,8,6,5,9,10,4,7; 乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算以上两组数据的平均数;(2)分别求出两组数据的方差;(3)若要从这两人中选一人参加射击比赛,选谁去合适?(4)甲、乙两名战士的成绩在 2s, 2s内有多少?xx解:(4)2= 31.73 ,23.54210.46ssxsxs甲甲甲甲甲甲甲甲甲甲, 因为2= 1.21.1024.829.2ssxsxs乙乙乙乙乙乙乙乙乙乙,因为所以甲战士的成绩全部在 2s, 2s内.xx所以乙战士的成绩全部在 2s, 2s内.xx
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。