1、第九章第九章 统计统计第九章第九章 统计统计9.2.4 总体离散程度的估计第九章 统计9 9. .2 2 用样本估计用样本估计总体总体第九章第九章 统计统计第九章第九章 统计统计平均数平均数、中位数中位数和和众数众数为我们提供了一组数据的为我们提供了一组数据的集中趋势集中趋势的信的信息息,这是概括一组数据的特征的有效方法,但仅知道集中趋势的信息,这是概括一组数据的特征的有效方法,但仅知道集中趋势的信息,很多时候还不能使我们做出有效决策,下面的问题就是一个例子很多时候还不能使我们做出有效决策,下面的问题就是一个例子. .问题3 有两位射击运动员在一次射击测试中各射靶10次,每次命中 的环数如下:
2、 甲:7 8 7 9 5 4 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7 如果你是教练,你如何对两位运动员的射击情况作如果你是教练,你如何对两位运动员的射击情况作出评价出评价? ?如果这是一次选拔性考核,你应当如何作出选择如果这是一次选拔性考核,你应当如何作出选择? ? 通过简单的排序和计算通过简单的排序和计算, ,可以发现甲、乙两名运动员射击成绩的可以发现甲、乙两名运动员射击成绩的平均平均数、中位数、众数都是数、中位数、众数都是7 7. .从这个角度看从这个角度看, ,两名运动员之间没有差别两名运动员之间没有差别. .第九章第九章 统计统计第九章第九章 统计统计现在我们画出
3、条形图直观感觉一下他们的成绩是否有差别现在我们画出条形图直观感觉一下他们的成绩是否有差别. .10 环数环数频率频率456 78910 环数环数频率频率456 789甲的成绩比较甲的成绩比较分散分散, ,乙的成绩相对乙的成绩相对集中集中, ,即甲的成绩波动幅度比较即甲的成绩波动幅度比较大,而乙的成绩比较稳定大,而乙的成绩比较稳定. .可见,他们的射击成绩是存在差异的可见,他们的射击成绩是存在差异的. . 那么,如何度量成绩的这种差异呢那么,如何度量成绩的这种差异呢? ?第九章第九章 统计统计第九章第九章 统计统计 一种简单的度量数据离散程度的方法就是用一种简单的度量数据离散程度的方法就是用极差
4、极差. .根据甲、乙运根据甲、乙运动员的动员的1010次射击成绩,可以得到次射击成绩,可以得到可以发现甲的成绩波动范围比乙的大可以发现甲的成绩波动范围比乙的大. .甲命中环数的极差甲命中环数的极差=10-4=10-4=6 6,乙命中环数的极差乙命中环数的极差=9-5=9-5=4 4. . 极差在一定程度上刻画了数据的离散程极差在一定程度上刻画了数据的离散程度度. .但因为极差只使用了数据中最大、最小两但因为极差只使用了数据中最大、最小两个值的信息个值的信息, ,对其他数据的取值情况没有涉及,对其他数据的取值情况没有涉及,所以极差所含的信息量很少所以极差所含的信息量很少. .用极差度量这种差异会
5、有缺点吗用极差度量这种差异会有缺点吗? 你还能想出其你还能想出其他刻画数据离散程他刻画数据离散程度的办法吗度的办法吗? ?第九章第九章 统计统计第九章第九章 统计统计 我们知道,如果射击的成绩很稳定我们知道,如果射击的成绩很稳定, ,那么大多数的射击成绩离平那么大多数的射击成绩离平均成绩不会太远;相反均成绩不会太远;相反, ,如果射击的成绩波动幅度很大,那么大多数如果射击的成绩波动幅度很大,那么大多数的射击成绩离平均成绩会比较远的射击成绩离平均成绩会比较远. . 因此因此, ,可以通过这两组射击成绩与它们的平均成绩的可以通过这两组射击成绩与它们的平均成绩的“平均距离平均距离”来度量成绩的波动幅
6、度来度量成绩的波动幅度. .如何定义如何定义“平均距离平均距离”?”?niixxn1|1 假设一组数据是假设一组数据是x x1 1, ,x x2 2, , ,x xn n,用,用 表示这组数据的平均数表示这组数据的平均数. . 我我们用每个数据与平均数的差的绝对值作为们用每个数据与平均数的差的绝对值作为“距离距离”, ,即即 的的“距距离离”.”.可以得到这组数据可以得到这组数据x x1 1, ,x x2 2, , ,x xn n到到 的的“平均距离平均距离”为为x第九章第九章 统计统计第九章第九章 统计统计niixxns122)(1niixxns12)(1方差:标准差: 标准差刻画了数据的标
7、准差刻画了数据的离散程度或波动幅度离散程度或波动幅度,标准差越大,标准差越大, ,数数据的离散程度越大据的离散程度越大; ;标准差越小,数据的离散程度越小。标准差越小,数据的离散程度越小。显然,在刻画数据的分散程度上,方差和标准差是一样的显然,在刻画数据的分散程度上,方差和标准差是一样的. .但在解但在解决实际问题中,一般多采用标准差。决实际问题中,一般多采用标准差。第九章第九章 统计统计第九章第九章 统计统计例例2 2 在对树人中学高一年级学生身高的调查中在对树人中学高一年级学生身高的调查中, ,采用样本量比例分采用样本量比例分 配的分层随机抽样,如果不知道样本数据配的分层随机抽样,如果不知
8、道样本数据, ,只知道抽取了男生只知道抽取了男生 23 23人人, ,其其平均数平均数和和方差方差分别为分别为170.6170.6和和12.5912.59, ,抽取了女生抽取了女生2727人人, , 其平均数和方差分别为其平均数和方差分别为160.6160.6和和38.6238.62. .你能由这些数据计算出你能由这些数据计算出 总样本的方差总样本的方差, ,并对高一年级全体学生身高方差作出估计吗并对高一年级全体学生身高方差作出估计吗? ?第九章第九章 统计统计第九章第九章 统计统计 样本标准差刻画了数据离平均数波动的幅度大小样本标准差刻画了数据离平均数波动的幅度大小, ,平均数和平均数和标准
9、差一起能反映数据取值的信息标准差一起能反映数据取值的信息. . 例如例如, ,根据根据9.2.19.2.1节中节中100100户居民用户的月均用水量数据,可户居民用户的月均用水量数据,可以计算出样本平均数以计算出样本平均数 =8.79 =8.79,样本标准差,样本标准差s6.20.s6.20.x x99.14,59. 2sxsx19.212,16. 32sxsx第九章第九章 统计统计第九章第九章 统计统计 如下图所示,可以发现如下图所示,可以发现, ,这这100100个数据中大部分落在区间个数据中大部分落在区间 -s, -s, +s=2.59,14.99 +s=2.59,14.99内内, ,在
10、区间在区间 -2s, +2s=-3.61 -2s, +2s=-3.61,21.1921.19外外的只有的只有7 7个个. .也就是说,绝大部分数据落在也就是说,绝大部分数据落在 -2s -2s, +2s +2s内内. .x xx xx xx xx xx x月均用水量月均用水量/t/t0.0770.077频率频率/ /组距组距0.1070.1070.0430.0430.0300.030 0.0300.0300.0170.0170.0100.0100.0130.0130.0070.0070 00.020.020.080.080.10.10.060.060.040.044.24.21.21.27.2
11、7.2 10.210.2 13.213.2 16.216.2 19.219.2 22.222.2 25.225.2 28.228.22.592.591414. .9 99 92121. .1 19 9第九章第九章 统计统计第九章第九章 统计统计1在教学调查中,甲、乙、丙三个班的数学测试成绩分布如图在教学调查中,甲、乙、丙三个班的数学测试成绩分布如图1、2、3,假设三个班的平均分都是,假设三个班的平均分都是75分,分,s1,s2,s3分别表示甲、乙、分别表示甲、乙、丙三个班数学测试成绩的标准差,则有丙三个班数学测试成绩的标准差,则有()图图1图图2图图3As3s1s2Bs2s1s3Cs1s2s3
12、 Ds3s2s1D课堂检测第九章第九章 统计统计第九章第九章 统计统计B第九章第九章 统计统计第九章第九章 统计统计3已知某省二、三、四线城市数量之比为已知某省二、三、四线城市数量之比为136,2019年年8月份月份调查得知该省所有城市房产均价为调查得知该省所有城市房产均价为1.2万元万元/平方米,方差为平方米,方差为20,二、,二、三、四线城市的房产均价分别为三、四线城市的房产均价分别为2.4万元万元/平方米,平方米,1.8万元万元/平方米,平方米,0.8万元万元/平方米,三、四线城市房价的方差分别为平方米,三、四线城市房价的方差分别为10, 8,则二线城,则二线城市的房价的方差为市的房价的方差为 118.52第九章第九章 统计统计第九章第九章 统计统计4、在一次科技知识竞赛中,某学校的两组学生的成绩如下表:在一次科技知识竞赛中,某学校的两组学生的成绩如下表:请根据你所学过的统计知识,判断这两个组在这次竞赛中的请根据你所学过的统计知识,判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由成绩谁优谁劣,并说明理由第九章第九章 统计统计第九章第九章 统计统计第九章第九章 统计统计第九章第九章 统计统计作业: