1、9.2.39.2.3总体集中趋势的估计总体集中趋势的估计1、定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2、计算一组n个数据的第p百分位数的步骤:第1步,按从小到大排列原始数据.第2步,计算i=np%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.温故知新总体集中趋势的估计平均数一组数据的和与这组数据个数的商.如:定义特征平均数对数据有“取齐”的作用,代表该组数据的平均水平,任何一个数据的改变,都会引
2、起平均数的变化,这是众数和中位数都不具有的性质,所以与众数中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.但平均数受数据中极端值的影响较大,使平均数在估计总体时的可靠性降低.总体集中趋势的估计平均数加权平均数与频率平均数加权平均数频率平均数 平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关在下图的三种分布形态中,平均数和中位数的大小存在什么关系?探究探究 一般来说,对一个单峰的频率分布直方图来说,一般来说,对一个单峰的频率分布直方图来说, 如果直方图的形状是如果直方图的形状是对称对称的的( (如图(如图(1 1)) ),那么,那么平均数和中位数大体平均数和
3、中位数大体上差不多上差不多; 如果直方图在如果直方图在右边右边“拖尾拖尾”( (如图(如图(2 2)) ),那么平均数,那么平均数大于大于中位数;中位数; 如果直方图在如果直方图在左边左边“拖尾拖尾”( (如图(如图(3 3)) ),那么平均数,那么平均数小于小于中位数中位数, ,也就是说,也就是说,平均数总是在平均数总是在“长尾巴长尾巴”那边那边总体集中趋势的估计众数一组数据中出现次数最多的数据(即频率分布最大值对应的样本数据)成为这组数据的众数.定义特征一组数据的众数可能不止一个,也可能没有,反映了该组数据的集中趋势1,2,3,4,5,6,7,8,9 ,10 没有众数1,2,3,4,4,5
4、,5,6,7 众数有两个,分别是4和51,2,3,4,5,5,6,7,8 众数是5总体集中趋势的估计中位数一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最中间的两个数据的平均数(当数据个数是偶数时),称为这组数据的中位数.定义特征一组数据的中位数是唯一的反映了该组数据的集中趋势,在频率分布直方图中中位数左边和右边的直方图的面积相等 众数只利用了出现次数最多的那个值的信息,众数只能告诉我们它比其他值出现的次数多,但并未告诉我们它比别的数值多的程度.因此,众数只能传递数据中的信息的很少一部分,对极端值也不敏感 一般地,对数值型数据(如用水量、身高、收入
5、、产量等)集中趋势的描述,可以用平均数、中位数; 对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数思考5.什么叫方差?有什么意义?定义:方差是样本数据到平均数的平均距离,一般用s2表示,计算公式思考5.什么叫方差?有什么意义?定义:方差是样本数据到平均数的平均距离,一般用s2表示,计算公式)(.)()(1222212xxxxxxnsn意义:反应了数据的离散程度,方差越大,数据的离散程度越大;方差越小,数据的离散程度越小.思考5.什么叫方差?有什么意义?定义:方差是样本数据到平均数的平均距离,一般用s2表示,计算公式)(.)()(1222212xxxxxxnsn思考6.
6、什么叫标准差?有什么意义?定义:标准差等于方差的算数平方根,计算公式:意义:反应了数据的离散程度,方差越大,数据的离散程度越大;方差越小,数据的离散程度越小.nxxxxxxsn22221)(.)()(小试牛刀小试牛刀题型一题型一 平均数、中位数和众数的计算平均数、中位数和众数的计算跟踪训练跟踪训练2 课堂小结课堂小结1、计算第p百分位数的步骤第1步,按从小到大排列原始数据. 第2步,计算第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据; 若i是整数,则第p百分位数为第i项与第(i1)项数据的平均数.i=np%课堂小结课堂小结2 2、通过频率分布直方图估计平均数、中位数、众数:、通过频率分布直方图估计平均数、中位数、众数:样本平均数:可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替样本中位数:把每个矩形的面积从左加起,加到接近0.5时(没超过)用0.5减去之前加得的面积,再用减得的数值除以下一组的面积,再乘以组距,再加上在与上一组之间的数就得到了中位数. 样本众数:频率分布直方图的众数估计值为最高矩形底边的中点课堂小结课堂小结