平均指标和变异指标参考课件.pptx

上传人(卖家):晟晟文业 文档编号:5222115 上传时间:2023-02-17 格式:PPTX 页数:105 大小:744.68KB
下载 相关 举报
平均指标和变异指标参考课件.pptx_第1页
第1页 / 共105页
平均指标和变异指标参考课件.pptx_第2页
第2页 / 共105页
平均指标和变异指标参考课件.pptx_第3页
第3页 / 共105页
平均指标和变异指标参考课件.pptx_第4页
第4页 / 共105页
平均指标和变异指标参考课件.pptx_第5页
第5页 / 共105页
点击查看更多>>
资源描述

1、1第一节 平均指标的概念、特点、种类 测度数据集中趋势的指标是平均指标,平均指标包括两大类:数值平均数和位置平均数。数值平均数是根据全部数据计算得到的,位置平均数是根据数据所处位置或部分指标值计算得到的;一、概念:平均指标就是反映同质总体内各单位某一数量标志值一般水平一般水平的综合指标。如:某企业的工人的平均工资可以代表这个企业工人工资收入的一般水平;全国粮食平均亩产量可以代表我国粮食生产的一般水平;2 二、特点 1、平均指标把总体各单位数量标志值之间的差异抽象化了。2、平均指标是总体各单位标志值的一般水平,反映了事物变动的集中趋势;三、种类 最通常的分类:数值平均数(包括算术平均数、调和平均

2、数和几何平均数)和位置平均数(中位数和众数);3第二节 数值平均数 一、算术平均数(arithmetic mean)(又可分为简单算术平均数简单算术平均数和加权算术平均数加权算术平均数)1、计算公式:算术平均数算术平均数=总体标志总量总体标志总量/总体单位总量总体单位总量注意注意:1)算术平均数的分子、分母是同一同一总体总体的两个总量指标,分子与分母存在着对应关系;2)算术平均数与强度相对指标虽然都是两个总量指标的对比关系,但两者存在实质差别;4 2、具体计算 1)简单算术平均数简单算术平均数:根据未分组整理的原始数据计算的平均值;计算公式为:式中:代表算术平均数;x代表各单位标志值;n代表总

3、体单位数;是总和符号;例:某班组有10人,某日的生产量分别为14、15、16、16、18、19、20、20、22、24件,则该班组的平均每人日生产量为:(14+15+16+16+18+19+20+20+22+24)/10=18.4件;nxnxxxxn.21 x 5 2)加权算术平均数加权算术平均数:次数就是权数。根据分组整理的数据计算的算术平均数;分两种情况:单项式数列:、当权数为绝对数:式中的f代表各组变量值出现的频数;例:fxfffffxfxfxxnnn.212211 某某生生产产班班组组按按日日产产量量分分组组表表 按日产量分组(件)x 工人人数(人)f 总产量(件)xf(1)(2)(3

4、)=(1)*(2)17 1 17 18 2 36 19 4 76 20 3 60 合合计计 10 189 6 根据上述资料,计算该生产小组平均日产量为:注意注意:简单算术平均数是这种情况的特例;、当权数为相对数:式中:代表权数,是相对数。9.1810/189fxfx ffxx ff7注意注意:权数为绝对数或相对数,计算结果是一致的;仍以上例为例:某某生生产产班班组组按按日日产产量量分分组组表表 按日产量分组(件)x 工人人数(人)f 比重(%)ff ffx(件)17 1 10 1.7 18 2 20 3.6 19 4 40 7.6 20 3 30 6.0 合合计计 10 100 18.9 8

5、根据组距数列计算加权算术平均数:与单项数列条件下计算加权平均数的方法相同,只需要以各组的实际平均数乘以相应的权数即可;但是,在编制组距数列时,由于原始数据量很大或原始数据根本没有给出来等原因,无法计算实际的组平均数,此时,只能用此时,只能用组中值组中值来来代替。代替。由于组中值来代替组实际平均数,要求组内部的标志值是均匀分布的,因此,按组中值计算的加权算术平均数只能是个近似值。组中值的含义和计算?9知识回顾知识回顾:组中值:每一组标志值中点位置的数值叫组中值。该数值代表各组数值的一般水平。成立前提:变量在组内的变化是均匀的或在组中值两侧呈对称分布状态;计算方法:闭口组的组中值=(上限+下限)/

6、2 只有上限的开口组组中值=上限-相邻组组距/2 只有下限的开口组组中值=下限+相邻组组距/210 其计算也分两种情况:、当权数为绝对数:其中xi代表组中值,而不是实际的变量值;fi代表每组的频数;、当权数为相对数:式中:代表权数,是相对数。fxfffffxfxfxxnnn.212211 ffxx ff11 例:权数是绝对数的组距数列的加权平均数的计算:某银行某年某月为 100 家企业贷款情况表 按贷款额分组(万元)组中值(万元)x 贷款企业数(个)f 各组贷款额(万元)xf 10 以下?20?10-20 15 10 150 20-30 25 22 550 30-40 35 34 1190 4

7、0 以上?14?合计 或或 100 2620 根据上述资料计算该银行为每家企业的平均贷款额为:万元2.261002620fxfx 12 例:权数是相对数的组距数列的加权平均数的计算:某银行某年某月为 100 家企业贷款情况表 按贷款额分组(万元)组中值(万元)x 贷款企业数(个)f 比重(%)ff ffx(万元)10 以下 5 20 20 1.0 10-20 15 10 10 1.50 20-30 25 22 22 5.50 30-40 35 34 34 11.90 40 以上 45 14 14 6.30 合计 100 100 26.20 根据上述资料计算该银行为每家企业的平均贷款额为:万元2

8、.26ffxx 13 3、加权算术平均数与简单算术平均数的最大区别区别在于:加权算术平均数受到变量值大小、次数两个因素的影响,而简单算术平均数只受变量值大小的影响。4、算术平均数的不足不足:容易受极端变量值的影响,使平均数的代表性变小;当组距数列为开口组时,由于组中值不好确定或不太准确,使平均数的代表性变小;14 5、算术平均数的数学性质(数学性质(P52)(1)算术平均数与其总体单位数的乘积等于各单位标志值的总和;(2)各个变量值与其算术平均数的离差之和等于0;即:(3)各个变量值与其算术平均数的离差平方和为最小值,即 为最小值;以简单算术平均数为例证明:0)(xx2)(xx15 设 为不等

9、于 的任意数,则 0 xx0 xxccxx0220222222220)()(;0)()(2)()()()(xxxxncncxxncxxcxxcxxcxxxx-16二、调和平均数(二、调和平均数(harmonic mean)1、含义、含义:是算术平均数的变形。是根据变量值的倒数计算的算术平均数的倒数,故又称倒数平均数倒数平均数,通常用 表示。2、计算方法、计算方法:分为简单调和平均数简单调和平均数和加权调和平均数加权调和平均数。(1)简单调和平均数:简单调和平均数:假定有n个变量值,x1,x2,x3xn,则简单调和平均数计算公式为:hx=xnnxxxxn11.11113 hx17 先看一个例子:

10、在菜市场上,某青菜早晨卖0.67元/千克,中午卖0.5元/千克,晚上卖0.4元/千克,请计算这种菜这一天的平均价格;1、用简单算术平均数方法计算:2、用简单调和平均数计算方法:52.034.05.067.0 x50.040.0150.0167.013hx18 前一种计算方法是依据早、中、晚的单价简单平均计算出来的,它只受早、中、晚单价的影响;而后一种简单调和平均数,不仅受早、中、晚不同价格的影响,还受早、中、晚买的商品重量的影响(隐含着早、中、晚各买一元钱,如果购买金额不同,则是我们后面将要讲解的加权调和平均数的概念了),所以计算出来的价格是不同的。那么那种价格更具有代表性呢?在销售量不同的情

11、况下,应考虑销售量这个因素对平均价格的影响,因此第二种价格更具有代表性;19 再看一个例子:某市场上三种不同蔬菜的价格分别是0.5元/斤,0.8元/斤,1.0元/斤,如果每种蔬菜各买一元钱的,则平均价格是多少?即各买一元钱的蔬菜的平均价格为0.71元;注意:注意:从这个例子我们可以体会调和平均数的经济意义。在这个例子中,平均价格=总金额/总数量,符合平均价格的基本计算公式;hx=元)(71.030.118.015.011 20(2)加权调和平均数加权调和平均数,计算公式为:hx=nnnmmmmmxmxmxmx.1.1111321332211=nnnmxmxmxmxmmmm1.111.33221

12、1321=mxm1 上式中:x代表标志值;m代表调和平均数的权数;21 例:根据下表某公司所属三个厂生产某种生产资料的情况,计算产品平均单位成本。某公司所属三个企业生产某种产品资料表 工厂 单位成本(元/件)x 总成本(万元)m 总产量(万件)m/x 甲 10 10 1 乙 8 32 4 丙 7.2 36 5 合计(7.8)78 10 平均单位成本=总成本/总产量=mxm1=1078=7.8 22 注意两点:(1)简单调和平均数是加权调和平均数的特例;当m1=m2=m3=mn=1时,加权调和平均数就是简单调和平均数;(2)从上例可以看出,调和平均数仍然是以总体标志总量除以总体单位总数计算的,在

13、经济内容和计算结果上与算术平均数一致,只是由于计算时依据的资料不同,而在计算公式和计算过程方面有别于算术平均数;如当m=xf时,加权调和平均数就是加权算术平均数;fxfxfxxfmxmxh1123 例:某公司员工工资情况如下表,请分别计算加权算术平均数和加权调和平均数;月工资x(元)工资总额m(元)员工人数f=m/x(人)800 48000 60 1000 70000 70 1600 32000 20 合计 150000 150 首先计算加权调和平均数,按照公式:100015015000016003200010007000080048000320007000048000332211321xmx

14、mxmmmmxh 再计算加权算术平均数,按照公式:100015015000020706020*160070*100060*800321332211ffffxfxfxx 24 3、调和平均数的特点 如果数列中有一标志值等于0,则无法计算;4、调和平均数与算术平均数比较:方法和资料不同,调和平均数一般是分子项已知,分母项未知;算术平均数一般是分母项已知,分子项未知。25三 几何平均数 1、含义含义:也称为几何均值、对数平均数,是n个变量值乘积的n次方根。当某些经济现象存在“总比率等于各个比率的连乘积”这种关系时,需要计算几何平均数。凡是变量值的连乘积等于总比率或总速度的现象都适用于计算几何平均数。

15、最典型的两种现象是流水作业线和银行存款。请大家思考一下流水作业线的平均合格率该怎么计算?26 2、分类及计算(1)简单几何平均数:假定有n个变量值x1,x2,x3,xn,则简单几何平均数的基本计算公式为:式中:代表几何平均数;x代表变量值,n代表变量值的个数,是连乘符号;nnnGxxxxxx.321Gx27 例:某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为95%、92%、90%、85%、80%,整个流水生产线产品的合格率为:%24.885349.080.085.090.092.095.055GX28(2)加权几何平均数,计算公式为:式中的fi代表各个变量值出现的次数;例:将一

16、笔钱存入银行,存期为10年,按复利计息。10年的利率分别为:第1年和第2年为0.05,第3年至第5年为0.08,第6年至第8年为0.10,第9年至第10年为0.12,求平均利率;年平均利率 则年平均利率为:1.0877-1=0.0877fnififxxxxGinfnfffxX1.3322110877.112.110.108.105.1102332GX29 四、几种平均数的比较 算术平均数 几何平均数 调和平均数 成立前提:标志值都属于正数,而且至少两个数不等;请大家用两个数的例子证明?hGXXX表示为:表示为:87.716.75.8121084GhXXX,变量值例例31第三节 位置平均数 算术

17、平均数、调和平均数和几何平均数都是根据总体全部标志值全部标志值计算的。中位数和众数不是根据全部标志值计算的,而是根据其在总体中所处的特殊位置特殊位置确定或根据部分标志值(实际上也部分标志值(实际上也是处于特殊位置的一些标志值)是处于特殊位置的一些标志值)计算的,因此叫位置平均数。一、分类:众数众数(mode)和中位数(中位数(median);32 二、众数二、众数 1、含义:、含义:总体中最常见的数值,也即是数列中重复出现次数最多的数值,通常用Mo表示。如果分布曲线没有明显的集中趋势或最高峰,则该变量无众数;如果分布曲线明显地存在一个众数,则称为单峰分布;如果有两个不邻近的数据具有相对较高的频

18、数(即使频数不相等),则称为双峰分布;也有可能出现多峰分布的情形;2、适用条件适用条件:n 较多且有明显集中趋势时适合用众数作为总体一般水平。3、确定方法:、确定方法:(1)对于原始数据或单项式分组资料:)对于原始数据或单项式分组资料:可以直接观直接观察察,即出现次数最多次数最多的数值;33 例:某商场某季度男皮鞋销售情况 男皮鞋号码(厘米)销售量(双)24.0 12 24.5 84 25.0 118 25.5 541 26.0 320 26.5 104 27.0 52 合计 1231 从上表可以看出:25.5厘米的鞋号销售量最多,即为众数。34(2)组距式分组资料:)组距式分组资料:先找出

19、众数所在组众数所在组 ,然后再用比例插值法推算众数的近似值近似值;计算公式为:;计算公式为:下限公式为:上限公式为:式中:L代表众数所在组下限,U代表众数所在组上限,d代表组距,代表众数所在组次数与其下限的邻组次数之差,代表众数所在组次数与其上限的邻组次数之差;dLM2110dUM212012GEFDCABfXf3f2f1dXLXUM012得到证明。同理,上限公式也可以dXMdffffffMXffCDffABABCDdABMXLLL2110123212032120 )()(众众数的两个计算公式可以从几何图形得到证数的两个计算公式可以从几何图形得到证明:明:CDMXdABMXCDEGABEFCE

20、DAEBLL00即,图中:36 例:从表上数据看,最大的频数是350,即众数组为700-800这一组,分别利用公式来计算众数:某企业职工按月工资分组资料表 累积次数 按月工资分组(元)职工人数(人)f 由低到高累积 由高到低累积 400-500 140 140 1500 500-600 190 330 1360 600-700 300 630 1170 700-800 350 980 870 800-900 260 1240 520 900-1000 200 1440 260 1000-1100 40 1480 60 1100-1200 20 1500 20 合计 1500 7.735100)

21、260350()300350(3003507000M7.735100)300350()260350(2603508000M37 课堂练习:请指出下面几组数据的众数;1、10个民工的年龄:15,19,35,38,39,42,43,45,46,52;2、某班15个学生的年龄:19,19,19,19,19,20,20,20,20,20,21,21,21,21,21;3、某部门10名员工月工资:1300,1500,1800,1800,1800,2100,2100,2100,2500,3000;38注意:注意:1、众数是一个位置平均数,它只考虑总体分布中最频繁出现的变量值,而不受各单位标志值的影响,从而

22、增强了对变量数列一般水平的代表性。不受极端值和开口组数列的影响。2、众数是一个不容易确定的平均指标,当分布数列没有明显的集中趋势而趋均匀分布时,则无众数可言;当变量数列是不等距分组时,众数的位置也不好确定。39三、中位数中位数 1、含义:、含义:把某种观察值按大小顺序排队后,处在该数列中点位置的观察值,通常以Me表示。在明显存在极端数值的情况下,用中位数比平均数更能代表总体的一般水平。2、确定方法、确定方法:根据资料的分组情况不同,确定中位数可分为:未分组资料、单项式分组资料和组距式分组资料三种情况。40(1)未分组资料)未分组资料:排序 确定位置(n+1)/2 (其中n为标志值的个数或总体单

23、位数)若n为奇数项,则居中点位置的数值即为中位数;若 n为偶数项,则居中的两个数值的平均数为中位数。例:有5个同学的年龄依次为16、17、18、19、21,则中位数的项次为(5+1)/2=3,则中位数是第三位上的标志值18岁;如果5位同学的年龄分别依次为16、17、18、21、24,则中位数是多少?如果有6个同学的年龄依次为16、17、19、20、21、23,则中位数的项次为(6+1)/2=3.5,则中位数是中间位置的两个标志值的算术平均数,即(19+20)/2=19.5;21nx (n 为 奇 数)2122nnxx(n 为 偶 数)eM41(2)单项式分组资料)单项式分组资料:累计次数(可以

24、向下也可以向上累积,结果一样)确定中位数位置,当某一组的累积频数最先达到总频数的一半,即(f/2),找出中位数:该组所对应的变量值即为中位数。例:某车间工人按产量分组表 累积次数 按产量分组(件)x 工人数(人)f 由低到高累积 由高到低累积 159 2?162 4?167 5?169 6?171 3?173 1?合计 21?42 填好数字的表如下:计算f/2=21/2=10.5。看哪一组的累积次数先达到10.5:不论是由低到高还是由高到低,中位数都在第3组,即标志值167件为产量中位数;某车间工人按产量分组表 累积次数 按产量分组(件)x 工人数(人)f 由低到高累积 由高到低累积 159

25、2 2 21 162 4 6 19 167 5 11 15 169 6 17 10 171 3 20 4 173 1 21 1 合计 21 43(3)组距式分组资料)组距式分组资料:前两步骤同上,找到中位数所在位置 根据公式(下限或上限)求出中位数的近似值。下限公式为:上限公式为:dfsfLMmme12dfsfUMmme1244 式中:Me代表中位数;L代表中位数所在组的下限;U代表中位数所在组的上限;d代表中位数所在组的组距;Sm-1代表中位数所在组以下的累积次数;Sm+1代表中位数所在组以上的累积次数;请大家先试着证明?45 例:第一步:确定中位数位置=1500/2=750;根据由低到高或

26、由高到低累积次数,中位数所在的组为第四组,即700-800这一组;第二步:根据公式计算;某企业职工按月工资分组资料表 累积次数 按月工资分组(元)职工人数(人)f 由低到高累积 由高到低累积 400-500 140 140 1500 500-600 190 330 1360 600-700 300 630 1170 700-800 350 980 870 800-900 260 1240 520 900-1000 200 1440 260 1000-1100 40 1480 60 1100-1200 20 1500 20 合计 1500 2f46 如果根据下限公式:如果根据上限公式:29.73

27、410035063075070021dfsfLMmme29.73410035052075080021dfsfUMmme47 课堂作业:某地区抽样调查职工家庭收入资料如下:按平均每人月收入分组(元)职工户数 100-200 6 200-300 10 300-400 20 400-500 30 500-600 40 600-700 240 700-800 60 800-900 20 试根据上述资料计算职工家庭平均每人月收入(用算术平均数公式),并计算确定中位数和众数;48 注意:1、中位数也是一种位置平均数,它也中位数也是一种位置平均数,它也不受极端值及开口组的影响,具有稳健性。(不受极端值及开口

28、组的影响,具有稳健性。(同众数同)同众数同)2 2、各单位标志值与中位数离差的绝对值之和为、各单位标志值与中位数离差的绝对值之和为最小值(相对于中位数和任一标志值而言)。最小值(相对于中位数和任一标志值而言)。(同算术平均数比较)(同算术平均数比较)3 3、对某些不具有数学特点或不能用数字测定的、对某些不具有数学特点或不能用数字测定的现象,可以用中位数求其一般水平。(例:印现象,可以用中位数求其一般水平。(例:印染厂对颜色的排列)染厂对颜色的排列)minmin即即:或或eeXMXM f49 四、众数、中位数和算术平均数的比较(一)算术平均数是数值平均数;(二)算术平均数和中位数在任何一组数据中

29、都存在而且具有唯一性;(三)算术平均数只能用于定量数据,中位数适用于定序数据与定量数据,众数适用于所有数据类型;(四)算术平均数受极端值的影响,而众数、中位数则不受;(五)算术平均数可以推算总体的有关总量指标,众数、中位数则不宜;f如图:0MMXe0eXMM、(六)六)三者的关系三者的关系0即即eXMM 1.1.当当总体分布呈对称状态时,三者合而为一总体分布呈对称状态时,三者合而为一,0(1).如如果果分分布布右右偏偏,则则eXMM 如图:fXX0MeM2.2.当当总体分布呈非对称状态时(总体分布呈非对称状态时(P58P58)0(2).如如果果分分布布左左偏偏,则则eXMM 如图:fXX0Me

30、M所以所以0 (X-M)0 ()如如果果,则则说说明明分分布布右右偏偏 或或上上偏偏 0 (X-M)0 ()如如果果,则则说说明明分分布布左左偏偏 或或下下偏偏 0 (X-M)0 如如果果,则则说说明明分分布布对对称称 000321(2)31(3)2根根据据卡卡尔尔 皮皮尔尔逊逊经经验验公公式式,还还可可以以推推算算出出:eeeMMXMMXXMM 所以分布右偏。,元 )(900)10002700(31)2(3100MMXXMMee一组工人的月收入众数为700元,月收入的算术平均数为1000元,则月收入的中位数近似值是:例例1.1.平平均指标只能适用于同质总体。均指标只能适用于同质总体。(同质异

31、量)同质异量)2.2.用用组平均数补充说明总平均数。(例子)组平均数补充说明总平均数。(例子)五、平均指标的运用原则五、平均指标的运用原则 某生产小组基期有工人15人,报告期人数增加到30人,两时期各技术等级的工人数和工资总额如下在下表中,每一级工的工资都涨了,但总平均工资却下降了!级别基 期报 告 期工人数(人)比重(%)工资总额(元)平均工资(元)工人数(人)比重(%)工资总额(元)平均工资(元)二级工 2 13.3 1000 50016 53.3 9600 600四级工 8 53.3 7200 90010 33.3100001000七级工 5 33.4 75001500 4 13.4 6

32、8001700合计15100.015700104730100.026400 880例例某工业部门100个企业年度利润计划完成程度资料如下:按计划完成程度分组(%)企业数 85-89.9 2 90-94.9 8 95-99.9 10100-104.9 40105-109.9 30110-114.9 10合 计100经计算,100个企业年度平均利润计划完成程度为103.35。3.3.用用分配数列补充说明平均数分配数列补充说明平均数例例58第四节 变易指标 一、变异指标的概念变异指标的概念:反映总体各单位标志值的差别大小程度的综合指标,又称为标志变动度。二、意义:平均指标是反映总体一般水平的综合指标

33、,掩盖了总体各单位标志值的数量差异,而变异指标反映总体内各个观察值之间差异程度,可以说明标志值的分散程度,还可以说明平均指标代表性的大小。它与平均指标结合运用,可以达到对现象总体的全面认识。三、作用:标志变动度是评价平均数代表性的依据。甲、乙两学生某次考试成绩列表语文数学物理化学政治英语甲 959065707585乙1107095508075 甲、乙两学生的平均成绩为80分,集中趋势一样,但是他们偏离平均数的程度却不一样。乙组数据的离散程度大,数据分布越分散,平均数的代表性就越差;甲组数据的离散程度小,数据分布越集中,平均数的代表性越大。例例60 四、种类:极差、四分位差、平均差、极差、四分位

34、差、平均差、方差和标准差、变异系数;方差和标准差、变异系数;全距全距R R四分位差四分位差Q.D.Q.D.平平 均均 差差A.D.A.D.标标 准准 差差S.D.()S.D.()离散系数离散系数V V61 五、极差五、极差 1、含义:、含义:极差(R)又称全距,是总体单位各标志值中最大值与最小值之差。2、计算(、计算(1)未分组或单项分组资料)未分组或单项分组资料(见例1):R=最大标志值最大标志值-最小标志值最小标志值(2)组距式分组资料)组距式分组资料:仅限于首末两组为闭口组,而仅限于首末两组为闭口组,而且计算出来的全距要比实际全距大一些且计算出来的全距要比实际全距大一些(见例2):R=末

35、组上限末组上限-首组下限首组下限 3、局限:、局限:由于极差是根据总体的极端变量值计算的,没有考虑中间变量值的变动情况,所以不能全面反映总体各个变量值的离散程度。因此,其应用受到局限。在实际中,仅限于检查产品质量的稳定性等,应用范围很小。对于开口组,无法计算全距。对于开口组,无法计算全距。62 例1:有两个学习小组的学习成绩分别为:甲组:60 70 80 90 100 乙组:78 79 80 81 82 两组的平均成绩都是80分,通过平均成绩的计算看不出两组学生的成绩差别,但计算全距:R甲=100-60=40分,而R乙=82-78=4分,因此通过全距的计算,可以判定:乙组的平均成绩更能代表乙组

36、学生的成绩水平;63 例2:给定下列数据:根据未分组资料计算全距:R=最大标志值最大标志值-最小标志值最小标志值=139-107=32 对上面数据进行组距分组的方法?1 17 122 124 129 139 107 1 17 130 122 125 108 131 125 1 17 122 133 126 122 1 18 108 1 10 1 18 123 126 133 134 127 123 1 18 1 12 1 12 134 127 123 1 19 1 13 120 123 127 135 137 1 14 120 128 124 1 15 139 128 124 121 64 第

37、一步:对数值进行大小排序;第二步:确定全距:139-107=32;第三步:用经验公式确定组数:m=1+lg50/lg2(约)=7 第四步:确定组距:=全距/组数=32/7(约)=4.6;为便于计算统计,也为了与组限的确定(以尾数5或0)衔接,确定组距为5;第五步:确定组限;第一组的下限应低于最小变量值(本例中为107),故第一组的下限取为105;最后一组的上限应大于最大变量值(本例中为139),故最后一组的上限取为140;65 组距分组的结果如下:根据组距分组结果运用公式计算:全距=末组上限末组上限-首组下限首组下限=140-105=35按 零 件 数 分 组(个)频 数 频 率(%)105-

38、110 3 6 110-115 5 10 115-120 8 16 120-125 14 28 125-130 10 20 130-135 6 12 135-140 4 8 合 计 50 100 根根据未分组资料求据未分组资料求Q.DQ.D.133(1)144()的的位位置置,的的位位置置为为变变量量值值的的项项数数nnQQn 2.2.计计算:算:1.1.概概念:念:将总体各单位的标志值按大小顺序排列,然后将数列分为四将总体各单位的标志值按大小顺序排列,然后将数列分为四等分,形成三个分割点等分,形成三个分割点(Q1、Q2、Q3),这三个分割点称为四分位数,这三个分割点称为四分位数,(其中第二个

39、四分位数其中第二个四分位数Q2就是数列的中位数就是数列的中位数Me)。四分位差四分位差 Q.D.=Q3-Q1六、四分位差六、四分位差Q.D.P113Q.D.P113岁。且他们之间最大差异为岁之间,至人的年龄集中在这表明,该小组有一半岁岁则的位置岁则的位置,为:岁人年龄某外语补习小组92819)9(19-28Q-QQ.D.)28(Q ,64)17(3Q )19(Q ,2417Q 34 28 25 24 22 19 17)(7133311例例68 当n+1不能被4整除时的处理方法:如一列数:1,1,2,7,9,11,16,21;Q1的位置=(8+1)/4=2.25;这时Q1的计算方法为:整数部分即

40、第2的数1+第3个数与第2个数的差的0.25,Q1为1.25;同理计算Q3;根根据分组资料求据分组资料求Q.D.Q.D.13f3f1)Q,Q44的的位位置置的的位位置置 2)2)若单项数列,则若单项数列,则Q Q1 1与与Q Q3 3所在组的标志值就是所在组的标志值就是Q Q1 1与与Q Q3 3的数值;的数值;若组距数列,确定了若组距数列,确定了Q Q1 1与与Q Q3 3所在组后,还要用以下公式求近似值:所在组后,还要用以下公式求近似值:131111133313344 QQffSSQLdQLdff13131313131313Q-1Q-113 ff dd SS f式式中中:、分分别别为为与与

41、所所在在组组的的下下限限、分分别别为为与与所所在在组组的的次次数数、分分别别为为与与所所在在组组的的组组距距、分分别别为为与与所所在在组组的的以以下下一一组组的的累累计计次次数数为为总总次次数数LLQQQQQQQQ 根据某车间工人日产零件分组资料,求Q.D.按日产零件分组(件)工人数(人)累计工人数(人)(较小制)5-10 12 1210-15 46 5815-20 36 9420-25 6100合 计100-95.541.1136.17.)(36.17536584100315Q )(41.1154612410010QQ ,7541003QQ ,254100 13313311QQDQQ件件在第

42、三组则的位置在第二组则的位置这表明有一半工人的日产量分布在11.41件至17.36件之间,且相差5.95件。例例 四四分位差不受两端各分位差不受两端各25%25%数值的影响,能对开口组数列的差异数值的影响,能对开口组数列的差异程度进行测定;程度进行测定;用用四分位差可以衡量中位数的代表性高低;该数值越大,表四分位差可以衡量中位数的代表性高低;该数值越大,表明明Q Q1 1Q Q2 2之间变量值分布越远离它们的重点之间变量值分布越远离它们的重点Q2Q2,即远离中位数,即远离中位数,则说明中位数的代表性越差;该数值越小,则说明中位数的则说明中位数的代表性越差;该数值越小,则说明中位数的代表性越好;

43、代表性越好;四四分位差不反映所有标志值的差异程度,它所描述的只是次分位差不反映所有标志值的差异程度,它所描述的只是次数分配中一半的离差,所以也是一个比较粗略的指标。数分配中一半的离差,所以也是一个比较粗略的指标。3.3.四四分位差的特点分位差的特点73 七、七、平均差 1、含义:、含义:平均差是总体各单位标志值与其算术平均数离差绝对值的平均数,通常用A.D表示。平均差是各标志值对平均数的平均距离,其数值越大,说明标志值的差异程度越大,各标志值的分布也越分散;请大家根据定义来计算下列一组数据的平均差:5,7,8,10,20;?74 2、计算:、计算:(1)未分组资料:)未分组资料:采用简单平均差

44、方法,计算公式为:以上面所给数据5,7,8,10,20来计算:第一步:计算平均数=10;第二步,用各标志值减平均数得到离差,分别为:-5,-3,-2,0,10;第三步,对离差取绝对值,得到:5,3,2,0,10;第四步:用离差绝对值之和除以离差的个数,即得到简单平均差A.D=(5+3+2+0+10)/5=4;nxxDA.75(2)单项式分组和组距式分组资料)单项式分组和组距式分组资料:采用加权平均差方法,计算公式为:例1:单变量分组示例:ffxxDA.某某生生产产班班组组按按日日产产量量分分组组表表 按日产量分组(件)x 工人人数(人)f 总产量(件)xf(1)(2)(3)=(1)*(2)17

45、 1 17 18 2 36 19 4 76 20 3 60 合合计计 10 189 76 第一步,计算平均数:第二步:计算平均差:9.1810/189fxfx 74.0342139.182049.181929.181819.1817.ffxxDA77例例2 组距数列计算平均差组距数列计算平均差 例如:某企业一生产车间100名职工日产量资料分组如下。日产量(件)日产量(件)人数(人)组中值(件)人数(人)组中值(件)离差离差 离差绝对值离差绝对值 离差绝对值离差绝对值*人数人数515 10 10 -16 16 1601525 35 20 -6 6 2102535 40 30 4 4 160354

46、5 15 40 14 14 210合计合计 100 740 平均数A=xf/f=2600/100=26(件)平均差A.D=740/100=7.4(件)78 八、方差与标准差八、方差与标准差 1、方差与标准差、方差与标准差(1)含义:含义:方差(方差()是总体各单位标志值与其算术平均数离差的平方的算术平均数。标准差标准差()是方差的平方根,故又称均方差均方差。由于其计算结果一般稍大于平均差由于其计算结果一般稍大于平均差,这对于在抽样估计时,提高推断的把握程度具有一定的意义,因此标准差是应用最广泛的标志变异指标;(2 2)计算:计算:A A、未分组资料:(简单法),计算公式未分组资料:(简单法),

47、计算公式为:为:2nxxnxx222)()(79 例:某汽车销售商2004年1-6月的宝马汽车销售量分别为:120、125、128、130、135、142;计算其销售量的标准差与方差;计算平均数:计算方差:计算标准差:1306142135130128125120 x6.496)130142()130135()130130()130128()130125()130120(222222204.76.4980 B B、分组资料:(加权法)分组资料:(加权法)计算步骤:平均数 离差 离差平方乘以次数 代入公式得到标准差。计算公式为:ffxxffxx222)()(81 例:连锁店商品销售额标准差计算表

48、按销售额分组(千美元)频数(个)f 组中值 x xf xx 2)(xx fxx2)(80-100 20 90 1800-123 15129 302580 100-150 50 125 6250-88 7744 387200 150-200 120 175 21000-38 1444 173280 200-250 180 225 63000 12 144 40320 250 以上 130 275 35750 62 3844 499720 合计 600 127800 1403100 213600127800fxfx(千美元)36.486001403100)(2ffxx(千美元)82 2、是非标志的

49、标准差 A、什么是是非标志是非标志:在对经济现象进行分析时,常把其全部单位划分为具有某种属性和不具有某种属性的两组,例如,将学生按性别划分为“男”、“女”,将产品划分为“合格”、“不合格”两组,由于这些反映单位属性或性质的标志不是数量标志,而是质量标志,且只有“是”与“非”两种表现,所以称之为“是非标志是非标志”,有时也称为“交替交替标志标志”。在进行抽样推断时,是非标志的标准差有着重要的意义。83 B、成数:成数:在总体中,是非标志只具有两种表现,把具有某种表现或不具有某种表现的单位数占全部总体单位数的比重称为成数成数。用字母表示为:P=N1/N 或或Q=N0/N,P+Q=1或或Q=1-P例

50、:例:某公司进口一批彩电共1000台,其中合格品980台,不合格20台,合格品占全部产品的98%,不合格产品占全部产品的2%。在这里,98%、2%都是成数,98%+2%=1;84 C、成数的平均数 是非标志表现了现象质的区别,因此计算平均数首先要把是非标志的两种标志是非标志的两种标志表现进行量化处理表现进行量化处理。一般以一般以1表示具有某表示具有某种标志表现,以种标志表现,以0表示另外相对的那种标表示另外相对的那种标志表现志表现,然后再根据平均数计算公式进行计算。练习:某公司进口一批彩电共1000台,其中合格品980台,不合格20台,合格品占全部产品的98%,不合格产品占全部产品的2%。请计

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(平均指标和变异指标参考课件.pptx)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|