1、9.2.4 9.2.4 总体离散程度的估计总体离散程度的估计 平均数平均数、中位数中位数和和众数众数为我们提供了一组数据为我们提供了一组数据的集中趋势的信息的集中趋势的信息,这是概括一组数据的特征的有这是概括一组数据的特征的有效方法效方法.但仅知道集中趋势的信息但仅知道集中趋势的信息,很多时候还不能使我很多时候还不能使我们做出有效的决策们做出有效的决策.导入问题问题1 1:有两名射击队员在一次射击测试中各射靶有两名射击队员在一次射击测试中各射靶1010次次,每每次命中的环数如下次命中的环数如下:如果你是教练,你如何对两位运动员的射击情况作出评如果你是教练,你如何对两位运动员的射击情况作出评价?
2、如果这是一次选拔性考核,你应当如何作出选择?价?如果这是一次选拔性考核,你应当如何作出选择?问题导入甲44577789910乙5667777889甲78795491074乙9578768677 分析:通过简单的排序和计算,可以发现甲、乙两名运动员射击成绩的平均数、中位数、众数都是7.7.从这个角度看,两名运动员之间没有差别。现在我们用方差来刻画两位射击运动员成绩的离散程度:现在我们用方差来刻画两位射击运动员成绩的离散程度:甲44577789910乙5667777889 由此可知,甲的成绩离散程度大,乙的成绩离散程度小,说由此可知,甲的成绩离散程度大,乙的成绩离散程度小,说明乙比甲的射击成绩稳定
3、。明乙比甲的射击成绩稳定。用每个数据与平均数的差的绝对值作为用每个数据与平均数的差的绝对值作为“距离距离”,即,即知识探究为了避免式中含有绝对值,通常改用平方来代替,即为了避免式中含有绝对值,通常改用平方来代替,即假设一组数据是假设一组数据是 ,用,用 表示这组数据的平均数表示这组数据的平均数。则这组数据到则这组数据到 的的“平均距离平均距离”为为我们将我们将 定义为这组数据的定义为这组数据的方差方差,用,用 表示表示因为因为公式的推导有时为了计算方差的方便,也用上述表达式计算方差有时为了计算方差的方便,也用上述表达式计算方差问题问题2 2:除了方差,除了方差,你还能想到其他刻画数据离散程度的
4、统计量吗?你还能想到其他刻画数据离散程度的统计量吗?一种简单的度量数据离散程度的方法就是一种简单的度量数据离散程度的方法就是极差极差。极差极差是数据的最大值与最小值的差,即是数据的最大值与最小值的差,即 极差极差在一定程度上刻画了数据的离散程度,可以发现甲在一定程度上刻画了数据的离散程度,可以发现甲的成绩波动范围比乙大。但因为极差只使用了数据中最大、的成绩波动范围比乙大。但因为极差只使用了数据中最大、最小两个值的信息,所含的信息量很少。最小两个值的信息,所含的信息量很少。甲命中环数的极差甲命中环数的极差=10-4=6乙命中环数的极差乙命中环数的极差=9-5=4甲44577789910乙5667
5、777889 由于方差的单位是原始数据的单位的平方,与原始数据不一由于方差的单位是原始数据的单位的平方,与原始数据不一致。为了使二者单位一致,我们对方差开方,取它的算数平方根,致。为了使二者单位一致,我们对方差开方,取它的算数平方根,即即我们称之为这组数据的我们称之为这组数据的标准差标准差,用,用 表示表示问题问题3 3:问题问题1 1中,方差的单位是什么?中,方差的单位是什么?问题问题4 4:方差和标准差的取值范围是什么?方差和标准差的取值范围是什么?如果方差和标准差为如果方差和标准差为0 0,这组数据有什么特点?,这组数据有什么特点?问题问题5 5 在对树人中学高一学生身高的调查中在对树人
6、中学高一学生身高的调查中,采用样本比例分配的分采用样本比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生层随机抽样,如果不知道样本数据,只知道抽取了男生2323人人,其平均数其平均数和方差分别为和方差分别为170.6170.6和和12.5912.59,抽取了女生,抽取了女生2727人人,其平均数和方差分别为其平均数和方差分别为160.6160.6和和38.62.38.62.你能由这些数据计算出总样本的平均数和方差吗?并对你能由这些数据计算出总样本的平均数和方差吗?并对高一年级全体学生的身高方差作出估计吗高一年级全体学生的身高方差作出估计吗?分层随机抽样样本方差的计算解:把男生样本记为
7、解:把男生样本记为 ,其平均数记为,其平均数记为 ,方差记为,方差记为 ;把总体数据样本的平均数记为把总体数据样本的平均数记为 ,方差记为,方差记为 ;把女生样本记为把女生样本记为 ,其平均数记为,其平均数记为 ,方差记为,方差记为 ;分层随机抽样样本方差的计算由由 得得 ,同理可得,同理可得 例例 在对树人中学高一学生身高的调查中在对树人中学高一学生身高的调查中,采用样本比例分配的分层随采用样本比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生机抽样,如果不知道样本数据,只知道抽取了男生2323人人,其平均数和方其平均数和方差分别为差分别为170.6170.6和和12.5912.5
8、9,抽取了女生,抽取了女生2727人人,其平均数和方差分别为其平均数和方差分别为160.6160.6和和38.62.38.62.你能由这些数据计算出总样本的平均数和方差吗?并对高一年你能由这些数据计算出总样本的平均数和方差吗?并对高一年级全体学生的身高方差作出估计吗级全体学生的身高方差作出估计吗?分层随机抽样样本方差的计算 因此,总样本的平均数为因此,总样本的平均数为165.2,方差约为,方差约为51.49,据此,据此估计高一年级全体学生的身高方差约为估计高一年级全体学生的身高方差约为51.49。问题问题6 6 比较总样本方差与男生组方差及女生组方差,你发现了什么?比较总样本方差与男生组方差及
9、女生组方差,你发现了什么?一般地,如果已知第一组数据的个数是一般地,如果已知第一组数据的个数是 ,平均数和方差分别,平均数和方差分别为为 和和 ,第二组数据的个数为,第二组数据的个数为 ,平均数和方差分别为,平均数和方差分别为 和和 ,那么,总样本平均数那么,总样本平均数总样本方差为总样本方差为问题问题7 7:一般地,如果知道两组数据各自的数据个数、平均数和方一般地,如果知道两组数据各自的数据个数、平均数和方差,如何计算全部数据的平均数和方差呢?差,如何计算全部数据的平均数和方差呢?问题问题8 8:平均数反映数据的集中趋势,标准差刻画了数据离平均数平均数反映数据的集中趋势,标准差刻画了数据离平均数的波动大小,那么将平均数和标准差综合在一起的波动大小,那么将平均数和标准差综合在一起.例如,考察以平例如,考察以平均数为中心的区间均数为中心的区间 ,观察数据分别落在这,观察数据分别落在这两个区间的百分比,你能发现什么?两个区间的百分比,你能发现什么?问题问题9 9:假设老师请你帮忙完成偶一个数据分析任务,给了你们学假设老师请你帮忙完成偶一个数据分析任务,给了你们学校全体高一年级学生的数学成绩数据,请你写一份数据分析报告校全体高一年级学生的数学成绩数据,请你写一份数据分析报告.结合这节课的学习内容,你会用哪些统计量?为什么?结合这节课的学习内容,你会用哪些统计量?为什么?课堂小结