1、分布的离中趋势二、分布的离中趋势 数据的离散程度是数据分布的另一个重要特征,它反映的是各变量值远离其中心值的程度,又称离中趋势。数据的离散程度越大,集中趋势的测度值对该组数据的代表性越差;反之,其代表性越好。常用的描述数据离散程度的测度值有全距、四分位差(quartile deviation)、方差(variance)、标准差(standard deviation)和离散系数等。二、分布的离中趋势 一、全距 全距也称为极差,它是表明总体单位标志数值变动范围的指标,是总体各单位全部变量值中两个极端值(最大值和最小值)之差,用R表示。其计算公式为 R=xmaxxmin (4-17)式中,R为全距;
2、xmax为标志的最大值;xmin为标志的最小值。二、分布的离中趋势 用全距衡量总体分布的离散程度,计算方法简单,便于理解,能说明总体中各标志值变动的最大范围。但全距是根据总体中的两个极端标志值进行计算的,并不能反映所有标志值差异的大小和总体单位的分配情况,并且受极端值的影响较大。二、分布的离中趋势 二、四分位差四分位差的概念四分位差的概念1.四分位数是通过三个点将全部数据四等分。如果用上四分位数减去下四分位数,可得内四分位间距或四分位间距。这个指标与一般极差的区别在于计算范围较窄,因而排除了部分极端值对变异指标的影响。但在运用指标进行分析时,人们一般习惯于取四分位间距的一半(四分位差,用QD表
3、示)。二、分布的离中趋势 四分位差的计算四分位差的计算2.计算四分位差的步骤是:首先求出Q1、Q3所在的位置;然后根据位置确定其对应标志值,即Q1、Q3;最后取这两者差额的一半。二、分布的离中趋势 三、方差和标准差方差和标准差的概念方差和标准差的概念1.方差是总体各单位标志值与其算术平均数的离差平方和的算术平均数,用2表示。标准差又称均方差,是总体各单位标志值与其平均数离差平方和的算术平均数的平方根,用表示。标准差是测定离散程度最常用、最重要的指标。二、分布的离中趋势 方差和标准差的计算方差和标准差的计算2.(1)方差的计算。(2)标准差的计算。二、分布的离中趋势 样本方差和样本标准差的计算样
4、本方差和样本标准差的计算3.样本方差是样本各单位标志值与其算术平均数的离差平方和的算术平均数,用s2表示。样本标准差是样本各单位标志值与其平均数离差平方和的算术平均值的平方根,用s表示。二、分布的离中趋势(2)样本标准差的计算。(1)样本方差的计算。二、分布的离中趋势 标准差的计算应用标准差的计算应用4.(1)未分组数据标准差的计算应用。【例4-18】某工厂某车间甲、乙两个组各有10名工人,每人日产某种零件数(单位:件)为 甲组:20,21,21,22,22,22,23,23,23,23 乙组:14,15,16,21,22,22,23,28,29,30 试计算两组工人的日产量的标准差。解:计算
5、过程见表4-11。二、分布的离中趋势 表表4 4-11 11 甲、乙两组工人日产量的标准差计算甲、乙两组工人日产量的标准差计算 从计算结果可以看出,在甲、乙两组工人平均日产量相等的情况下,乙组的标准差大于甲组,因而乙组平均数的代表性更差一些。二、分布的离中趋势 (2)已分组数据标准差的计算应用。由于方差的计算单位为平方单位,不易于直接比较,因而,标准差在经济统计中应用得更为广泛。以上计算的标准差是通过一系列的变量值与平均数计算后而得出的变异结果,它是针对变量(数量标志)现象而言的。如果是品质标志,它所表现的属性只分为两种情况。如性别这一品质标志只分为男、女两种属性;产品质量这一品质标志只分为合
6、格和不合格两种属性;等等。通常,要研究的那个属性称为“是”,非研究的那个属性称为“非”。我们经常研究“是”属性所占的比重,即成数。二、分布的离中趋势 在统计实践中,有时需要计算成数的标准差,即是非标志的标准差。是非标志把总体分成两个部分:一部分具有某种标志,另一部分不具有此种标志。这种用“是”或“非”来表示总体单位特征的标志,称为是非标志。计算是非标志的标准差时要把是非标志从质的差别转化为量的差别,一般把“是”的标志值用“1”代替,把“非”的标志值用“0”代替;总体单位数用N表示;具有所研究的标志的单位数用N1表示,成数用P表示,P=N1/N;不具有所研究的标志的单位数用N0表示,成数用Q表示
7、,Q=N0/N。显然,N1+N0=N,P+Q=1。二、分布的离中趋势 表表4 4-13 13 某年级学生的资料某年级学生的资料【例4-20】某年级学生的资料见表4-13,求成数的标准差。二、分布的离中趋势 解:成数的平均数为 成数的标准差为 由具体数值可计算出 男生成数的标准差为二、分布的离中趋势 四、离散系数 上面介绍的各离散程度测度值都是反映数据分散程度的绝对值。其数值的大小,一方面取决于原变量值本身水平的高低,即与变量的均值大小有关,变量值的绝对水平越高,离散程度的测度值越大;变量值的绝对水平越低,离散程度的测度值越小。另一方面,它们与原变量值的计量单位相同,但当采用不同计量单位计量变量
8、值时,其离散程度的测度值将不同。因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用标准差比较的。为了消除变量值平均水平高低和计量单位对离散程度测度值的影响,需要计算离散系数。二、分布的离中趋势 表表4 4-14 14 乙车间的生产情况乙车间的生产情况 【例4-22】某企业有甲、乙两个车间,甲车间的平均产量为81件,标准差为9.9件,乙车间的生产情况见表4-14。试计算乙车间的平均产量,并比较甲、乙两个车间哪个车间的平均产量更具代表性。二、分布的离中趋势 解:(1)乙车间的平均产量为 乙车间平均产量的标准差为 由乙=9.16(件)从计算结果看,虽然甲,但是由于甲、乙两个车间的平均产量不等,故不能直接肯定说明甲车乙间产量的变动程度比乙车间大,应该通过计算标准差系数来加以判断。乙=9.16(件)二、分布的离中趋势 (2)甲车间的标准差系数为 乙车间的标准差系数为 因为V甲V乙,所以,甲车间的平均产量更具有代表性,即乙车间产量的变动程度更大。谢谢谢谢观观
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。