1、9.2.49.2.4总体离散程度的估计总体离散程度的估计(唯唯一一;不不一一定定是是样样本本数数据据中中的的某某个个数数)1212.nnnxxxxxxxnn :一一般般地地,如如果果有有 个个数数,.,.,平平那那么么=叫叫这这 个个均均数数数数的的平平均均数数.复习回顾复习回顾众数众数:在一组数据中,出现在一组数据中,出现次数最多次数最多的数据的数据.中位数中位数:将一组数据按大小依次排列,把处在将一组数据按大小依次排列,把处在最中间位置最中间位置的一个数据(或的一个数据(或最中间两个数据的最中间两个数据的平均数平均数)12(),.,kiink knxxxxf(2 2)如如果果 个个数数据据
2、中中,不不同同的的值值有有个个,记记为为其其中中 出出现现的的频频均均数数:数数为为加加权权平平,iixpx 若若其其中中 出出现现的的频频率率为为则则1122kkx px px p 1、众数在样本数据的频率分布直方图中,就是众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。最高矩形的中点的横坐标。复习回顾复习回顾二、利用二、利用频率分布直方图(频率分布表)频率分布直方图(频率分布表),求样本,求样本的平均数、中位数和众数的近似估计,进而估计总的平均数、中位数和众数的近似估计,进而估计总体的平均数、中位数和众数体的平均数、中位数和众数.2、在样本中,有在样本中,有50的个体小于或等
3、于中位数,也的个体小于或等于中位数,也有有50的个体大于或等于中位数的个体大于或等于中位数,因此,在频率分布直,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。由此可以估计中位数的值。3、平均数是频率分布直方图的平均数是频率分布直方图的“重心重心”.是直方是直方图的平衡点图的平衡点.频率直方图中每个小长方形的面积乘以频率直方图中每个小长方形的面积乘以小矩形底边中点的横坐标之和。小矩形底边中点的横坐标之和。三、三、三种数字特征的优缺点三种数字特征的优缺点 1、众数体现了样本数据的最大集中点,但它对、众数体现
4、了样本数据的最大集中点,但它对其它数据信息的忽视使得其它数据信息的忽视使得无法客观地反映总体特征无法客观地反映总体特征.复习回顾复习回顾 2、中位数是样本数据所占频率的等分线,、中位数是样本数据所占频率的等分线,它不它不受少数几个极端值的影响,受少数几个极端值的影响,这在某些情况下是优点,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。但它对极端值的不敏感有时也会成为缺点。3、由于平均数与每一个样本的数据有关,所以、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如
5、此是众数、中位数都不具有的性质。也正因如此,与众,与众数、中位数比较起来,数、中位数比较起来,平均数可以反映出更多的关于平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。影响较大,使平均数在估计时可靠性降低。样本的众数、中位数和平均数常用来表示样本样本的众数、中位数和平均数常用来表示样本数据的数据的“中心值中心值”,其中众数和中位数容易计算,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数不受少数几个极端值的影响,但只能表达样本数据中的少量信息据中的少量信息.平均数代表
6、了数据更多的信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平但受样本中每个数据的影响,越极端的数据对平均数的影响也越大均数的影响也越大.当样本数据质量比较差时,当样本数据质量比较差时,使使用众数、中位数或平均数描述数据的中心位置用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本可能与实际情况产生较大的误差,难以反映样本数据的实际状况,数据的实际状况,很多时候还不能使我们做出有很多时候还不能使我们做出有效决策效决策.因此,我们需要一个统计数字刻画样本因此,我们需要一个统计数字刻画样本数据的数据的离散程度离散程度.新课引入新课引入高中数
7、学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)引例:引例:在一次射击选拔赛中,甲、乙两名运动员各在一次射击选拔赛中,甲、乙两名运动员各射击射击1010次,每次命中的环数如下:次,每次命中的环数如下:甲:甲:7 8 7 9 5 4 9 10 7 47 8 7 9 5 4 9 10 7 4乙:乙:9 5 7 8 7 6 8 6 7 79 5 7 8 7 6 8 6 7 777xx甲乙,新课引入新课引入甲、乙两人本次射击的平均成绩分别为多少环?甲、乙两人本次射击的平均成
8、绩分别为多少环?甲、乙两名运动员射击成绩中位数、众数分别为多少环?甲、乙两名运动员射击成绩中位数、众数分别为多少环?通过简单的排序可以发现甲、乙两名运动员射击通过简单的排序可以发现甲、乙两名运动员射击成绩的中位数、众数也都是成绩的中位数、众数也都是7如果你是教练,你如何对两位运动员的射击情况作出如果你是教练,你如何对两位运动员的射击情况作出评价?在这一次选拔性考核中,你应当如何作出选择?评价?在这一次选拔性考核中,你应当如何作出选择?高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计
9、课件(共34张PPT)思考:思考:甲、乙两人射击的平均成绩相等甲、乙两人射击的平均成绩相等,观察两人成绩观察两人成绩的频率分布的频率分布条形图条形图,你能说明其水平差异在那里吗?,你能说明其水平差异在那里吗?环数环数频率频率0.40.40.30.30.20.20.10.14 5 6 7 8 9 10 4 5 6 7 8 9 10 O O(甲)(甲)环数环数频率频率0.40.40.30.30.20.20.10.14 5 6 7 8 9 10 4 5 6 7 8 9 10 O O(乙)(乙)甲的成绩比较分散,波动幅度较大,甲的成绩比较分散,波动幅度较大,乙的成绩相对集中,比较稳定乙的成绩相对集中,
10、比较稳定.新课引入新课引入一种简单的度量数据一种简单的度量数据离散程度离散程度的方法就是的方法就是用极差用极差,根,根据甲、乙运动员的据甲、乙运动员的10次射击成绩,可以得到次射击成绩,可以得到甲命中环数的极差甲命中环数的极差=10-4=6 乙命中环数的极差乙命中环数的极差=9-5=4.有差异高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)45678910环数频率0.10.20.3(甲)456789 100.10.20.30.4环数频率(乙)频率一组数据的最大
11、值与最小值的差一组数据的最大值与最小值的差极差:极差:极差越大,数据越分散,越不稳定极差越大,数据越分散,越不稳定极差越小,数据越集中,越稳定极差越小,数据越集中,越稳定极差体现了数据的离散程度极差体现了数据的离散程度高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)极差在一定程度上刻画了数据的离散程度,但极差在一定程度上刻画了数据的离散程度,但因为因为极差只使用了数据中最大、最小两个值的信极差只使用了数据中最大、最小两个值的信息息,对其他数据的取值情况没有涉及
12、,所以,对其他数据的取值情况没有涉及,所以极差极差所含的信息量很少所含的信息量很少.我们知道,如果射击的成绩很稳定,那么大多我们知道,如果射击的成绩很稳定,那么大多数的射击成绩离平均成绩不会太远;相反,如果数的射击成绩离平均成绩不会太远;相反,如果射击的成绩波动幅度很大,那么大多数的射击成射击的成绩波动幅度很大,那么大多数的射击成绩离平均成绩会比较远,绩离平均成绩会比较远,因此,我们可以通过这两组射击成绩与它们的因此,我们可以通过这两组射击成绩与它们的平均成绩的平均成绩的“平均距离平均距离”来度量成绩的来度量成绩的波动幅度波动幅度.新课引入新课引入高中数学人教A版(2019)必修(第二册)9.
13、2.4总体离散程度的估计课件(共34张PPT)高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)学习新知学习新知思考:对于样本数据思考:对于样本数据x1,x2,xn,用,用 表示这组表示这组数据的平均数数据的平均数.设想通过各数据到其平均数的平均距离设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何来反映样本数据的分散程度,那么这个平均距离如何计算?计算?x所谓所谓“平均距离平均距离”,其含义可作如下理解:,其含义可作如下理解:x。xxxxxin的距离是到表示这组数据的平均数假设样本数据是,.,21).,2,1(nixxi
14、:xxxx,n是平均距离的到样本数据于是”“,21.21nxxxxxxn高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)学习新知学习新知为了避免式中含有绝对值,通常改用平方来代替,即为了避免式中含有绝对值,通常改用平方来代替,即22212()()()nxxxxxxn-+-+-L我们称上式为这组数据的我们称上式为这组数据的方差方差(variance).有时为了计算方差有时为了计算方差的方便,我们还把方差写成右的方便,我们还把方差写成右式形式式形式211()nii
15、xxn即2211inixxn由于方差的单位是原始数据的单位的平方,与原始由于方差的单位是原始数据的单位的平方,与原始数据不一致数据不一致.为了使二者单位一致,我们对方差开平为了使二者单位一致,我们对方差开平方,取它的算术平方根,即方,取它的算术平方根,即)()()(122221xxxxxxnn我们称上式为这组数据的我们称上式为这组数据的标准差标准差(standard deviation).高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)标准差为标准差为0 0的
16、数据有何特点?的数据有何特点?都相等都相等.学习新知学习新知我们称下式为这组数据的我们称下式为这组数据的标准差标准差(standard deviation).思考:标准差的取值范围是什么?思考:标准差的取值范围是什么?,0如果总体中所有个体的变量值分别为如果总体中所有个体的变量值分别为Y1,Y2,,YN,总体平均数为总体平均数为 ,则称则称YS S2 2=为总体方差为总体方差.N2ii 11YYN()2211()NiiSSYYN总体标准差高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的
17、估计课件(共34张PPT)学习新知学习新知与总体均值类似,总体方差也可以写成加权的形式,与总体均值类似,总体方差也可以写成加权的形式,如果总体的如果总体的N个变量值中,不同的值共有个变量值中,不同的值共有k(kN)个,个,不妨记为不妨记为Y1,Y2,.,Yk,其中其中Y,出现的频数为出现的频数为f(i=1,2,.,k),则则总体方差总体方差为为 S S2 2=高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)思考:思考:对于一个容量为对于一个容量为2的样本:的样
18、本:x1、x2(x1s乙乙可知,甲的成绩离散程度大,乙的成绩离散可知,甲的成绩离散程度大,乙的成绩离散程度小,由此可以估计,乙比甲的射击成绩稳定程度小,由此可以估计,乙比甲的射击成绩稳定.如果要从这两名选手中选择一名参加比赛,要看一下如果要从这两名选手中选择一名参加比赛,要看一下他们的平均成绩在所有参赛选手中的位置,如果两人都他们的平均成绩在所有参赛选手中的位置,如果两人都排在前面,就选成绩稳定的乙选手,否则可以选甲排在前面,就选成绩稳定的乙选手,否则可以选甲.【典例】【典例】1.(20171.(2017全国卷全国卷)为评估一种农作物的种植为评估一种农作物的种植效果效果,选了选了n n块地作试
19、验田块地作试验田.这这n n块地的亩产量块地的亩产量(单位单位:kg):kg)分别为分别为x x1 1,x,x2 2,x,xn n,下面给出的指标中可以用来评估这下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是种农作物亩产量稳定程度的是()A.xA.x1 1,x,x2 2,x,xn n的平均数的平均数 B.xB.x1 1,x,x2 2,x,xn n的标准差的标准差C.xC.x1 1,x,x2 2,x,xn n的最大值的最大值 D.xD.x1 1,x,x2 2,x,xn n的中位数的中位数B2 2(导学(导学P122P122例例1 1).已知某已知某7 7个数的平均数为个数的平均数为4,
20、4,方差为方差为2,2,现加入一个新数据现加入一个新数据4,4,此时这此时这8 8个数的平均数为个数的平均数为 ,方差方差为为s s2 2,则则()A.=4,sA.=4,s2 2222C.4,sC.4,s2 224,sD.4,s2 222xxxxx2.2.=4.=4.又因为这又因为这7 7个数的方差为个数的方差为2,2,且加入一个新且加入一个新数据数据4,4,所以这所以这8 8个数的方差个数的方差s s2 2=2.=,所以乙机床加工零件的质量更稳定所以乙机床加工零件的质量更稳定.2s甲2s乙导学导学P124如果数据如果数据的平均数为的平均数为 ,方差为方差为(1 1)新数据)新数据的平均数为的
21、平均数为,方差仍为,方差仍为 (2 2)新数据)新数据的平均数为的平均数为,方差为,方差为 (3 3)新数据)新数据的平均数为的平均数为 ,方差为方差为 ,则,则方差的运算性质:方差的运算性质:典型例题典型例题课本例课本例6 在对树人中学高一年级学生身高的调查在对树人中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽样,如果不中,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生知道样本数据,只知道抽取了男生23人,其平均数人,其平均数和方差分别为和方差分别为170.6和和12.59,抽取了女生抽取了女生27人,其人,其平均数和方差分别为平均数和方差分别为160.
22、6和和38.62.你能由这些数你能由这些数据计算出总样本的方差,并对高一年级全体学生的据计算出总样本的方差,并对高一年级全体学生的身高方差作出估计吗?身高方差作出估计吗?解:把男生样本记为解:把男生样本记为x1,x2,,x23,其平均数记为其平均数记为 ,方差记为方差记为 ;把女生样本记为把女生样本记为y1,y2,.y27,其平均数记其平均数记为为 ,方差记为方差记为 ;把总样本数据的平均数记为把总样本数据的平均数记为 ,方差记为方差记为 .根据方差的定义,总样本方差为根据方差的定义,总样本方差为x2xsy2ysz2s2327222111()()50ijijsxzyz2327165.22327
23、xyz典型例题典型例题2327222111()()50ijijsxzyz232722111()()50ijijxxxzyyyz232322211()()2()()()iiiiixxxzxxxxxzxz232311()230,iiiixxxx由可得2323112()()2()()0iiiixxxzxzxx2712()()0jjyyyz同理可得典型例题典型例题2327222111()()50ijijsxzyz232722111()()50ijijxxxzyyyz232722222111()()()()50ijijsxxxzyyyz因此23232727222211111()()()()50ijiij
24、jxxxzyyyz男生男生23人,其平均数和方差分别为人,其平均数和方差分别为170.6和和12.59,女生女生27人,其平均数和方差分别为人,其平均数和方差分别为160.6和和38.62165.2z 把已知的男生、女生样本平均数和方差的取值代入,可得把已知的男生、女生样本平均数和方差的取值代入,可得251.4862s 2222123()27()50 xysxzsyz导学P123方法技巧学习新知学习新知练练在一个文艺比赛中,在一个文艺比赛中,8名专业人士和名专业人士和12名观名观众代表各组成一个评判小组,给参赛选手打众代表各组成一个评判小组,给参赛选手打分在给某选手的打分中,专业人士打分的平分
25、在给某选手的打分中,专业人士打分的平均数和标准差分别为均数和标准差分别为47.4和和3.7,观众代表打分,观众代表打分的平均数和标准差为的平均数和标准差为56.2和和11.8,试根据这些数,试根据这些数据计算这名选手得分的平均数和据计算这名选手得分的平均数和方方差差练练在一个文艺比赛中,在一个文艺比赛中,8名专业人士和名专业人士和12名观众代表各名观众代表各组成一个评判小组,给参赛选手打分在给某选手的打组成一个评判小组,给参赛选手打分在给某选手的打分中,专业人士打分的平均数和标准差分别为分中,专业人士打分的平均数和标准差分别为47.4和和3.7,观众代表打分的平均数和标准差为观众代表打分的平均
26、数和标准差为56.2和和11.8,试根据这,试根据这些数据计算这名选手得分的平均数和些数据计算这名选手得分的平均数和方方差差所以这名选手得分的平均数为所以这名选手得分的平均数为52.68分,分,方方差为差为107.6高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)归纳总结归纳总结高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)
27、典型例题典型例题析析:分别求出这两分别求出这两组数据的众数、中位数、组数据的众数、中位数、平均数和方差,从这几平均数和方差,从这几个方面进行统计分析个方面进行统计分析解解(1)甲组成绩的众数为甲组成绩的众数为90,乙组成绩的众数为,乙组成绩的众数为70,从,从成绩的众数比较看,甲组成绩好些成绩的众数比较看,甲组成绩好些高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)高中
28、数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)归纳总结归纳总结高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)100t假假设设通通过过简简单单随随机机抽抽样样,获获得得了了户户居居民民的的月月均均用用水水量量数数据据(单单位位:)9.0
29、13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.02.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.52.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.92.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.4 22.43.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.022.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.95.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.75.5 6.
30、0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.35.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.87.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6规律印证规律印证计算出样本平均数 =,样本标准差s .x8.796.20高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)规律印证规律印证2.59,14.99,23.61,221.19.xsxsxsxs 如图所示,可以发现,这
31、如图所示,可以发现,这100个数据中大部分落在个数据中大部分落在区间区间 内,在区间内,在区间 外的只有外的只有7个个.也就是说,绝大部分数据落在也就是说,绝大部分数据落在 内内.,xs xs2,2 xs xs2,2 xs xs 样本标准差刻画了数据离平均数波动的浮动大小,样本标准差刻画了数据离平均数波动的浮动大小,平均数和标准差一起能反映数据取值的信息平均数和标准差一起能反映数据取值的信息.高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)课堂小结课堂小结1.
32、极差的极差的定义及特征:定义及特征:2.方差、标准差的定义及特征方差、标准差的定义及特征 总体方差、总体标准差的定义总体方差、总体标准差的定义 样本方差、样本标准差的定义样本方差、样本标准差的定义3.会求方差、标准差,并做出决策会求方差、标准差,并做出决策5.会求分层抽样的方差会求分层抽样的方差4.方差的运算性质:方差的运算性质:高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)1、必做题:完成学案导学P122P124 2、必做题:课时跟踪检测四十3、周末作业:章末综合检测(四)A卷 高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)高中数学人教A版(2019)必修(第二册)9.2.4总体离散程度的估计课件(共34张PPT)