1、 一、一、知识回顾知识回顾 1.1.直方图中求平均数直方图中求平均数 每个小矩形底边中点的横坐标与小矩形的面积的乘积之和每个小矩形底边中点的横坐标与小矩形的面积的乘积之和. . 2.2.直方图中求中位数直方图中求中位数 中位数左边和右边的直方图的面积相等中位数左边和右边的直方图的面积相等. . 3.3.直方图中求众数直方图中求众数 表示最高矩形的区间的中点表示最高矩形的区间的中点. . 平均数、中位数和众数为我们提供了一组数据的集中趋势的平均数、中位数和众数为我们提供了一组数据的集中趋势的 信息,这是概括一组数据的特征的有效方法,但仅知道集中趋势信息,这是概括一组数据的特征的有效方法,但仅知道
2、集中趋势 的信息,很多时候还不能使我们做出有效决策,下面的问题就是的信息,很多时候还不能使我们做出有效决策,下面的问题就是 一个例子一个例子. . 问题问题3 3 有两位射击运动员在一次射击测试中各射靶有两位射击运动员在一次射击测试中各射靶1010次次, ,每次命中每次命中 的环数如下的环数如下: : 甲:甲:7 8 7 9 5 4 9 10 7 47 8 7 9 5 4 9 10 7 4 乙:乙:9 5 7 8 7 6 8 6 7 79 5 7 8 7 6 8 6 7 7 如果你是教练,你如何对两位运动员的射击情况作出评价如果你是教练,你如何对两位运动员的射击情况作出评价? ?如如 果这是一
3、次选拔性考核,你应当如何作出选择果这是一次选拔性考核,你应当如何作出选择? ? 通过简单的排序和计算通过简单的排序和计算, ,可以发现甲、乙两名运动员射击成绩可以发现甲、乙两名运动员射击成绩 的平均数、中位数、众数都是的平均数、中位数、众数都是7.7.从这个角度看从这个角度看, ,两名运动员之间没两名运动员之间没 有差别有差别. . 两名运动员射击成绩的平均数、中位数、众数各为多少?两名运动员射击成绩的平均数、中位数、众数各为多少? 二、二、探究新知探究新知 从上图中看,甲的成绩比较分散从上图中看,甲的成绩比较分散, ,乙的成绩相对集中乙的成绩相对集中, ,即甲的即甲的 成绩波动幅度比较大,而
4、乙的成绩比较稳定成绩波动幅度比较大,而乙的成绩比较稳定. .可见,他们的射击成可见,他们的射击成 绩是存在差异的绩是存在差异的. . 那么,如何度量成绩的这种差异呢那么,如何度量成绩的这种差异呢? ? 现在我们画出条形图直观感觉一下他们的成绩是否有差别现在我们画出条形图直观感觉一下他们的成绩是否有差别. . 10 10 环数环数 频率频率 4 4 5 5 6 6 7 7 8 8 9 910 10 环数环数 频率频率 4 4 5 5 6 6 7 7 8 8 9 9 一种简单的度量数据离散程度的方法就是用一种简单的度量数据离散程度的方法就是用极差极差. .根据甲、乙根据甲、乙 运动员的运动员的10
5、10次射击成绩,可以得到次射击成绩,可以得到 可以发现甲的成绩波动范围比乙的大可以发现甲的成绩波动范围比乙的大. . 甲命中环数的极差甲命中环数的极差=10-4=6=10-4=6, 乙命中环数的极差乙命中环数的极差=9-5=4.=9-5=4. 二、二、探究新知探究新知 极差在一定程度上刻画了数据的离散程度极差在一定程度上刻画了数据的离散程度. . 但因为极差只使用了数据中最大、最小两个值但因为极差只使用了数据中最大、最小两个值 的信息的信息, ,对其他数据的取值情况没有涉及,所以对其他数据的取值情况没有涉及,所以 极差所含的信息量很少极差所含的信息量很少. . 我们知道,如果射击的成绩很稳定我
6、们知道,如果射击的成绩很稳定, ,那么大多数的射击成绩离那么大多数的射击成绩离 平均成绩不会太远;相反平均成绩不会太远;相反, ,如果射击的成绩波动幅度很大,那么大如果射击的成绩波动幅度很大,那么大 多数的射击成绩离平均成绩会比较远多数的射击成绩离平均成绩会比较远. . 因此因此, ,可以通过这两组射击可以通过这两组射击 成绩与它们的平均成绩的成绩与它们的平均成绩的“平均距离平均距离”来度量成绩的波动幅度来度量成绩的波动幅度. . 你还能想出其你还能想出其 他刻画数据离散程他刻画数据离散程 度的办法吗度的办法吗? ? 如何定义如何定义“平均距离平均距离”?”? 为什么用为什么用 “平均距离平均
7、距离” 刻画离散程刻画离散程 度,用度,用“总总 距离距离 行吗行吗? ? 假设一组数据是假设一组数据是x x1 1, ,x x2 2, , ,x xn n,用,用 表示这组数表示这组数 据的平均数据的平均数. . 我们用每个数据与平均数的差的绝对我们用每个数据与平均数的差的绝对 值作为值作为“距离距离”, ,即即 x x x x|x|xi i- |(i=1,2,- |(i=1,2, , ,n)n)作为作为x xi i到到 的的“距离距离”. .可以得到这组数据可以得到这组数据x x1 1, ,x x2 2, , ,x xn n到到 的的 “平均距离平均距离”为为 x xx x . n n 1
8、 1i i i i | |x xx x| | n n 1 1 二、二、探究新知探究新知 三、三、方差和标准差方差和标准差 为了避免式中含有绝对值,通常改用平方来代替,即为了避免式中含有绝对值,通常改用平方来代替,即 n n 1 1i i 2 2 i i ) )x x(x(x n n 1 1 方差:方差: 有时为了计算方便,还把有时为了计算方便,还把方差方差写成:写成: n n 1 1i i 2 2 i i x xx x n n 1 1 2 可以使用计算器求可以使用计算器求 一组数据的方差,需要一组数据的方差,需要 注意的是,计算器可能注意的是,计算器可能 按按 计算方计算方 差,此时需要乘差,
9、此时需要乘 进进 行调整行调整. . n n 1 1i i 2 2 i i ) )x x(x(x 1 1n n 1 1 - n n 1 1- -n n 由于方差的单位是原始数据单位的平由于方差的单位是原始数据单位的平 方方, ,与原始数据不一致与原始数据不一致. .为了使二者单位一为了使二者单位一 致致, ,对方差开平方对方差开平方, ,取它的算术平方根取它的算术平方根, ,即即 n n 1 1i i 2 2 i i ) )x x(x(x n n 1 1 标准差:标准差: 标准差的取标准差的取 值范围是什么值范围是什么? ? 标准差为标准差为0 0的一的一 组数据有什么组数据有什么 特点特点?
10、 ? 0,+)0,+) 所有数据都相等所有数据都相等 如果总体中所有个体的变量值分别为如果总体中所有个体的变量值分别为Y Y1 1,Y Y2 2, , ,Y YN N,总体平均,总体平均 数为数为 ,则,则Y Y N N 1 1i i 2 2 i i 2 2 ) )Y Y(Y(Y N N 1 1 S S 总体方差:总体方差: N N 1 1i i 2 2 i i 2 2 ) )Y Y(Y(Y N N 1 1 S SS S总体标准差:总体标准差: 与总体均值类似,总体方差也可以写成加权的形式与总体均值类似,总体方差也可以写成加权的形式. .如果总体如果总体 的的N N个变量值中,不同的值共有个变
11、量值中,不同的值共有k(kN)k(kN)个个, ,不妨记为不妨记为Y Y1 1, ,Y Y2 2, , , Y Yk k, , 其中其中Y Yi i出现的频数为出现的频数为f fi i(i=1,2(i=1,2, , ,k),k),则则 k k 1 1i i 2 2 i ii i 2 2 ) )Y Y(Y(Yf f N N 1 1 S S 总体方差:总体方差: 如果样本中所有个体的变量值分别为如果样本中所有个体的变量值分别为y y1 1,y y2 2, ,y,yn n,样本平均,样本平均 数为数为 ,则,则 y y n n 1 1i i 2 2 i i 2 2 ) )y y(y(y n n 1
12、1 s s 样本方差:样本方差:样本标准差:样本标准差: n n 1 1i i 2 2 i i 2 2 ) )y y(y(y n n 1 1 s ss s 三、三、方差和标准差方差和标准差 标准差刻画了数据的离散程度或波动幅度,标准差越大标准差刻画了数据的离散程度或波动幅度,标准差越大, ,数据数据 的离散程度越大的离散程度越大; ;标准差越小,数据的离散程度越小标准差越小,数据的离散程度越小,显然,在刻,显然,在刻 画数据的分散程度上,方差和标准差是一样的画数据的分散程度上,方差和标准差是一样的. .但在解决实际问题但在解决实际问题 中,一般多采用标准差中,一般多采用标准差. . 在实际问题
13、中,总体平均数和总体标准差都是未知的在实际问题中,总体平均数和总体标准差都是未知的. .就像用就像用 样本平均数估计总体平均数一样样本平均数估计总体平均数一样, ,通常我们也用样本标准差去估计通常我们也用样本标准差去估计 总体标准差总体标准差. .在随机抽样中,样本标准差依赖于样本的选取,具有在随机抽样中,样本标准差依赖于样本的选取,具有 随机性随机性. . 在问题在问题3 3中,我们可以根据标准差来判断两名运动员的成绩的中,我们可以根据标准差来判断两名运动员的成绩的 离散程度,计算可得离散程度,计算可得 s s甲 甲=2 =2,s s乙 乙1.095. 1.095. 由由s s甲 甲 s s
14、乙乙可知,甲的成绩离散程度大,乙的成绩离散程度小 可知,甲的成绩离散程度大,乙的成绩离散程度小. . 由此可以估计,乙比甲的射击成绩稳定由此可以估计,乙比甲的射击成绩稳定. . 如果要从这两名选手中选择一名参加比赛如果要从这两名选手中选择一名参加比赛, ,要看一下他们的平要看一下他们的平 均成绩在所有参赛选手中的位置均成绩在所有参赛选手中的位置. .如果两人都排在前面,就选成绩如果两人都排在前面,就选成绩 稳定的乙选手,否则可以选甲稳定的乙选手,否则可以选甲. . 三、三、方差和标准差方差和标准差 例例1 1 某工厂某工厂3636名工人的年龄数据如下表名工人的年龄数据如下表. . 工人编号工人
15、编号 1 12 23 34 45 56 67 78 89 9 1010 1111 1212 1313 1414 1515 1616 1717 1818 年龄年龄4040 4444 4040 4141 3333 4040 4545 4242 4343 3636 3131 3838 3939 4343 4545 3939 3838 3636 工人编号工人编号 1919 2020 2121 2222 2323 2424 2525 2626 2727 2828 2929 3030 3131 3232 3333 3434 3535 3636 年龄年龄2727 4343 4141 3737 3434 42
16、42 3737 4444 4242 3434 3939 4343 3838 4242 5353 3737 4949 3939 (1)(1)抽取编号成等差数列抽取编号成等差数列9 9个样本,其首项为个样本,其首项为2 2,公差为,公差为4 4,列,列 出样本的年龄数据;出样本的年龄数据; (2)(2)计算计算(1)(1)中样本的平均值中样本的平均值 和方差和方差s s2 2; (3)(3)3636名工人中年龄在名工人中年龄在 -s-s与与 +s+s之间有多少人?之间有多少人? x x x xx x 解:解:(1)(1)样本的年龄数据依次为:样本的年龄数据依次为:44,40,36,43,36,37
17、,44,43,37.44,40,36,43,36,37,44,43,37. (2)(2)x x (44+40+36+43+36+37+44+43+37)(44+40+36+43+36+37+44+43+37)9=9= 4040 s s2 2= =(44-40)(44-40)2 2+(40-40)+(40-40)2 2+(37-40)+(37-40)2 2 9=9= 1 1 0 0 0 0 9 9 (3)(3)由由(2)(2)得得s sx x-, 3 3 2 2 3636s sx x. . 3 3 1 1 4343 所以所以3636名工人中年龄在名工人中年龄在 -s-s与与 +s+s之间的之间的
18、人数人数为为x xx x2323. . 四、四、典型例题典型例题 例例2 2 在对树人中学高一年级学生身高的调查中在对树人中学高一年级学生身高的调查中, ,采用样本量比例分采用样本量比例分 配的分层随机抽样,如果不知道样本数据配的分层随机抽样,如果不知道样本数据, ,只知道抽取了男生只知道抽取了男生 23 23人人, ,其平均数和方差分别为其平均数和方差分别为170.6170.6和和12.5912.59, ,抽取了女生抽取了女生2727人人, , 其平均数和方差分别为其平均数和方差分别为160.6160.6和和38.62.38.62.你能由这些数据计算出你能由这些数据计算出 总样本的方差总样本
19、的方差, ,并对高一年级全体学生身高方差作出估计吗并对高一年级全体学生身高方差作出估计吗? ? 解解: : 把男生样本记为把男生样本记为x x1 1,x x2 2,x x23 23,其平均数记为 ,其平均数记为 , ,方差记为方差记为 s sx x2 2;把女生样本记为;把女生样本记为y y1 1,y y2 2,y y27 27,其平均数记为 ,其平均数记为 , ,方差方差 记为记为s sy y2 2;把总样本数据的平均数记为;把总样本数据的平均数记为 ,方差记为,方差记为s sz z2 2. . x x y y z z z z(170.6(170.623+160.623+160.627)27
20、)50=50= 165.2 165.2 由由( (x x1 12 2+ + +x x23 232 2) ) 23-170.623-170.62 2=12.59=12.59得得x x1 12 2+ + +x x23 232 2= =669689.85 669689.85 由由( (y y1 12 2+ +y+y27 272 2) ) 27-160.627-160.62 2=38.62=38.62得得y y1 12 2+ +y+y27 272 2= =697436.46 697436.46 ssz z2 2= =( (z z1 12 2+ +z+z50 502 2) ) 50- 50- 2 2z
21、z =(669689.85+697436.46)=(669689.85+697436.46)50-165.250-165.22 2 我们可以计算出总样本的方差为我们可以计算出总样本的方差为51.486251.4862,并据此估计高,并据此估计高 一年级学生身高的总体方差为一年级学生身高的总体方差为51.4862.51.4862. = =51.486251.4862 四、四、典型例题典型例题 样本标准差刻画了数据离平均数波动的幅度大小样本标准差刻画了数据离平均数波动的幅度大小, ,平均数和标平均数和标 准差一起能反映数据取值的信息准差一起能反映数据取值的信息. . 例如例如, ,根据根据9.2.
22、19.2.1节中节中100100户居民用户的月均用水量数据,可以户居民用户的月均用水量数据,可以 计算出样本平均数计算出样本平均数 =8.79 =8.79,样本标准差,样本标准差s6.20.s6.20.x x s sx x-s sx x2.592.59,14.9914.99, 2 2s s- -x x2 2s sx x-3.61-3.61,21.19.21.19. 如下图所示,可以发现如下图所示,可以发现, ,这这100100个数据中大部分落在区间个数据中大部分落在区间 -s, -s, +s=2.59,14.99 +s=2.59,14.99内内, ,在区间在区间 -2s, +2s=-3.61
23、-2s, +2s=-3.61,21.1921.19外外 的只有的只有7 7个个. .也就是说,绝大部分数据落在也就是说,绝大部分数据落在 -2s -2s, +2s +2s内内. . x x x xx xx x x xx x 月均用水量月均用水量/t/t 0.0770.077 频率频率/ /组距组距0.1070.107 0.0430.043 0.0300.0300.0300.030 0.0170.0170.010 0.0100.013 0.013 0.0070.007 0 0 0.020.02 0.080.08 0.10.1 0.060.06 0.040.04 4.24.21.21.27.27.
24、2 10.210.2 13.213.2 16.216.2 19.219.2 22.222.2 25.225.2 28.228.2 2.592.591414. .9 99 92121. .1 19 9 四、四、典型例题典型例题 五、课堂小结五、课堂小结 n n 1 1i i 2 2 i i 2 2 ) )x x(x(x n n 1 1 s s 方差:方差: 标准差:标准差: n n 1 1i i 2 2 i i 2 2 ) )x x(x(x n n 1 1 s ss s 假设一组数据是假设一组数据是x x1 1, ,x x2 2, , ,x xn n, ,用用 表示这组数据的平均数表示这组数据的平均数, ,则则x x 六、巩固提升六、巩固提升 课堂练习课堂练习: : 第第213213页练习第页练习第1 1、3 3、4 4、5 5题题 课堂作业课堂作业: : 第第214214页页习题习题9.29.2第第2 2、3 3、8 8、1010题题