1、3-1STAT3-2STAT3-3STAT3-4STAT1.反映社会经济现象在一定时间、地点、条件下所达到的总规模、总水平或工作总量。2.用绝对数表示,又称为绝对数、绝对数指标或绝对指标。3.是计算相对指标和平均指标的基础。3-5STAT1.按反映的内容不同分:总体总量总体总量是总体中单位数之和,说明总体本身规模的大小。如企业数、人口数等标志总量标志总量是总体中各个单位某一数量标志值的总和。如工业总产值、工资总额等。总量指标总量指标 总体总量总体总量 标志总量标志总量 3-6STAT2.按反映的时间状态不同按反映的时间状态不同分:分:时期指标:时期指标:反映社会经反映社会经济现象在一段时期内发
2、济现象在一段时期内发展过程的总数量。如产展过程的总数量。如产品产量、工资总额、销品产量、工资总额、销售额等售额等时点指标:时点指标:反映社会经反映社会经济现象在某一时点(或济现象在某一时点(或时刻)所表现的数量特时刻)所表现的数量特征的总量。如人口数、征的总量。如人口数、商品库存量、企业数等。商品库存量、企业数等。总量指标总量指标时期指标时期指标时点指标时点指标3-7STAT1.1.是社会经济现象中两个相互联系的指标数值之是社会经济现象中两个相互联系的指标数值之比比。也称为相对数也称为相对数2.2.无名数形式:系数、倍数、成数、百分数、千无名数形式:系数、倍数、成数、百分数、千分数、万分数分数
3、、万分数3.3.有名数形式:如周转次数(次)、周转天数有名数形式:如周转次数(次)、周转天数(天)、人口密度(人(天)、人口密度(人/平方公里)平方公里)3-8STAT1.1.计划完成相对指标计划完成相对指标2.结构相对指标结构相对指标3.比较相对指标比较相对指标4.动态相对指标动态相对指标5.强度相对指标强度相对指标3-9STAT分子、分母不互换,一般用百分数表示。分子、分母不互换,一般用百分数表示。实际完成数实际完成数计划任务数计划任务数计划完成程度相对指标计划完成程度相对指标=100%3-10STAT 例如,某企业某年计例如,某企业某年计划规定工业总产值为划规定工业总产值为5 0915
4、091万元万元(按现行价按现行价格计算格计算),实际达到,实际达到 5 1785 178万元万元(按现行价按现行价格计算格计算),则该企业,则该企业该年度的工业总产值该年度的工业总产值计划完成程度为:计划完成程度为:工业总产值计划完成程度相对指标工业总产值计划完成程度相对指标=51785091100%=101.71%3-11STAT例如,某企业某例如,某企业某年规定工业总产年规定工业总产值比上年提高值比上年提高8 8,实际执行结,实际执行结果比上年提高果比上年提高1212。则该企业该。则该企业该年度的工业总产年度的工业总产值计划完成程度值计划完成程度为:为:工业总产值计划完成程度相对指标工业总
5、产值计划完成程度相对指标=1+12%100%1+8%=103.70%1+12%1+12%100%1+12%=103.70%100%1+12%=103.70%100%1+12%=103.70%100%1+12%该企业工业总产值实际比计划超额完成该企业工业总产值实际比计划超额完成3.73.7,即,即103.7103.7100100=3.7=3.73-12STAT某企业计划规定某企业计划规定20102010年的可比产年的可比产品成本比品成本比20092009年年降低降低5 5,实际执,实际执行结果可比产品行结果可比产品成本比上年降低成本比上年降低6 6,则可比产品,则可比产品成本计划完成情成本计划完
6、成情况为:况为:计划完成程度相对指标计划完成程度相对指标=1-6%100%1-5%=98.95%该企业可比产品成本实际比计划超额完成该企业可比产品成本实际比计划超额完成1.051.05,即,即10010098.9598.95=1.05=1.053-13STAT1.1.属成果收入性质的指标属成果收入性质的指标,计划完成相对指标以等于或大于100%为好,超过100%的部分表示超额完成计划的程度,不足100%表示未完成计划的程度。2.2.属消耗支出性质的指标属消耗支出性质的指标,计划完成相对指标以小于或等于100%为好,小于100%的部分表示超额完成计划的程度,大于100%表示未完成计划的程度。3-
7、14STAT1.计划执行进度的检查计划执行进度的检查报告期内从期初至目报告期内从期初至目前的累计完成数成数前的累计完成数成数报告期累计计划数报告期累计计划数累计完成计划百分数累计完成计划百分数=100%3-15STAT1.例:某贸易企业商品销售额年计划为2000万元,16月实际完成的商品销售额为1200万元。则:计划执行进度计划执行进度=12002000100%=60%上半年完成计划的60%。全年时间过半,任务完成60%,如果按此进度年底将超额完成任务。3-16STAT1.总体的各组数值与全部总体数值之比,表明构成事物总体的各个组成部分在总体中所占的比重,说明总体结构2.结构相对指标一般用百分
8、数或系数来表示,各部分占总体的比重之和必须等于100或1。3.分子分母不能互换总体部分数值总体部分数值总体全部数值总体全部数值结构相对指标结构相对指标=3-17STAT1.同类现象在不同空间的对比2.同一总体内的不同部分之比。有时又把这种形式称为比例相对数。例如:我国第三、四、五次人口普查的结果,男女性别比例分别为:106.3,106.6,106.74。3.分子分母可以互换某条件下的某类指标数值某条件下的某类指标数值另一条件下的同类指标数值另一条件下的同类指标数值比较相对指标比较相对指标=3-18STAT1.同类现象在不同时期的对比2.反映现象在时间上发展变化的方向和程度3.也称为发展速度报告
9、期水平报告期水平基期水平基期水平动态相对指标动态相对指标=3-19STAT1.两个性质不同但有联系的指标对比2.表明现象强度、密度和普遍程度3.常用复名数表示,由分子、分母的原有计量单位组成4.有正指标、逆指标之分5.指标带有平均的形式,但不是平均指标,如人均国民生产总值、人均粮食产量等某一总量指标数值某一总量指标数值另一有联系而性质不同的总量指标数值另一有联系而性质不同的总量指标数值强度相对指标强度相对指标=3-20STAT1.1999年末我国总人口为125 909万人,人口密度=125909人/960万平方公里131人平方公里2.2009年我国人口密度=132256/960 138人平方公
10、里3.2008年中国国内生产总值为300670亿元,人口约为13.28亿人,人均GDP:22640元人民币,2008年底汇率:1美元-6.8346元人民币,人均GDP:约为3313美元3-21STAT一、众数二、中位数三、四分位数四、均值五、几何均值六、众数、中位数和均值的比较3-22STAT众数(mode)1.一组数据中出现次数最多的变量值2.适合于数据量较多时使用3.不受极端值的影响4.一组数据可能没有众数或有几个众数5.主要用于分类数据,也可用于顺序数据和数值型数据3-23STAT众数(不惟一性)无众数无众数原始数据:10 5 9 12 6 83-24STAT中位数(median)1.排
11、序后处于中间位置上的值min1eniiMx3-25STAT21n中位数位置为偶数为奇数nxxnxMnnne12221213-26STAT【例】【例】9个家庭的人均月收入数据 原始数据原始数据:1500 750 780 1080 850 960 2000 1250 1630 排排 序序:750 780 850 960 1080 1250 1500 1630 2000 位位 置置:1 2 3 4 5 6 7 8 9521921n位置3-27STAT【例】:【例】:10个家庭的人均月收入数据 排排 序序:660 750 780 850 960 1080 1250 1500 1630 2000 位位
12、置置:1 2 3 4 5 6 7 8 9 10 5.5211021n位置102021080960中位数3-28STAT1.排序后处于25%和75%位置上的值2.不受极端值的影响3.主要用于顺序数据,也可用于数值型数据,但不能用于分类数据3-29STAT434ULnQnQ位置位置3-30STAT【例】:【例】:9个家庭的人均月收入数据(4种方法计算)原始数据原始数据:1500 750 780 1080 850 960 2000 1250 1630 排序排序:750 780 850780 850 960 1080 1250 1500 1250 1500 1630 2000 位置位置:1 2 32
13、3 4 5 6 6 7 7 8 975.649325.249UL位置位置QQ5.79725.0)780850(780LQ5.143775.0)12501500(1250UQ3-31STAT1.集中趋势的最常用测度值2.一组数据的均衡点所在3.体现了数据的必然性特征4.易受极端值的影响5.用于数值型数据,不能用于分类数据和顺序数据3-32STAT设一组数据为:x1,x2,xnNxNxxxniiN121nxnxxxxniin1213-33STATniikiiikkkffxffffxfxfxx11212211KiiKiiiKKKffxffffxfxfx112122113-34STAT 按身高分组(厘
14、米)身高组中值(厘米)人数(人)160以下160164164168168172172176176180180以上1581621661701741781825153580352010合计-2001585162 15182 1020034100170.5200 xfXf厘米3-35STAT 1.各变量值与均值的离差之和等于零niixx12min)(niixx10)(3-36STAT1.n 个变量值乘积的 n 次方根2.适用于对比率数据的平均3.主要用于计算平均增长率4.计算公式为nniinnmxxxxG121nxxxxnGniinm121lg)lglg(lg1lg3-37STAT 【例】【例】一位
15、投资者购持有一种股票,在2000年、2001年、2002年和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率%0787.81%9.101%5.125%1.102%5.1044G%5.84%9.1%5.25%1.2%5.4G3-38STAT将一笔款存入银行,存将一笔款存入银行,存期期10年,以复利计息。年,以复利计息。10年的利率见右表。要年的利率见右表。要求:计算平均年利率。求:计算平均年利率。时间123568910年利率(%)23563-39STAT由于是以复利计息,各年的利息是在前一年的累计存款额(本金+利息)的基础上计息,因此应先将各年利
16、率换算成各年的本利率。这样各年的本利率(1+年利率)的连乘积等于总的本利率(设为G)。于是可以用加权几何平均数计算平均年本利率。1023321.021.031.051.061.0399G 平均年利率为3.99%。3-40STAT3-41STAT3-42STAT1.众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用2.中位数不受极端值影响数据分布偏斜程度较大时应用3.均值易受极端值影响数学性质优良数据对称分布或接近对称分布时应用3-43STAT一、异众比率一、异众比率二、极差二、极差三、四分位差三、四分位差四、方差和标准差四、方差和标准差五、离散系数五、离散系数3-44STAT异众比率(v
17、ariation ratio)1.非众数组的频数占总频数的比例 2.衡量众数对一组数据的代表性。3.异众比率越大,众数的代表性就越差;反之,异众比率越小,众数的代表性就越好。4.用于测度分类数据的离散程度,也可用于顺序数据和定量数据 5.计算公式为1iimmrifffVff rimVff:异众比率:总频数:众数组频数3-45STAT极差(range)1.一组数据的最大值与最小值之差2.变量值离散程度的最简单测度值3.易受极端值影响4.未考虑数据的分布5.计算公式为3-46STAT1.也称内距2.上四分位数与下四分位数之差四分位差QD=QU QL3.反映了中间50%数据的离散程度4.不受极端值的
18、影响5.可用于衡量中位数的代表性3-47STAT1.离散程度的测度值之一2.最常用的测度值3.反映了数据的分布4.反映了各变量值与均值的平均差异5.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差3-48STAT未分组数据:未分组数据:NxNii122)(NfKiii122)X(NxNii12)(NfKiii12)X(3-49STAT未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除!1)(122nxxsnii1)X(122nfxskiii1)(12nxxsnii1)X(12nfxskiii3-5
19、0STAT1.一组数据中可以自由取值的数据的个数2.当样本数据的个数为 n 时,若样本均值x 确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值3.例如,样本有3个数值,即x1=2,x2=4,x3=9,则 x=5。当 x=5 确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值3-51STAT1.标准差与其相应的均值之比2.对数据相对离散程度的测度3.消除了数据水平高低和计量单位的影响4.用于对不同组别数据离散程度的比较5.计算公式为vxsvs3-52STAT3-53STAT3-54STAT1.统计学
20、家Pearson于1895年首次提出。是指数据分布的不对称性 2.测度统计量是偏态系数(coefficient of skewness)3.偏态系数=0为对称分布;0为右偏分布;0为左偏分布4.偏态系数大于1或小于-1,为高度偏态分布;偏态系数在0.51或-1-0.5之间,为是中等偏态分布;偏态系数越接近0,偏斜程度就越低5.计算公式 3313()kiiixxfns3-55STAT1.统计学家Pearson于1905年首次提出。数据分布峰值的高低 2.测度统计量是峰态系数(coefficient of kurtosis)3.峰态系数=3扁平峰度适中4.峰态系数3为尖峰分布6.计算公式4414(
21、)kiiixxfns3-56STAT3-57STATZ值只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数分布的形状,而只是使该组数据均值为0,标准差为1 ixXZ3-58STAT9个家庭人均月收入标准化值计算表个家庭人均月收入标准化值计算表 家庭编号家庭编号人均月收入(元)人均月收入(元)标准化值标准化值 z 1234567891500 750 7801080 850 960200012501630 0.695-1.042-0.973-0.278-0.811-0.556 1.853 0.116 0.9963-59STAT经验法则表明:当一组数据对称分布时l
22、约有68%的数据在平均数加减1个标准差的范围之内l约有95%的数据在平均数加减2个标准差的范围之内l约有99%的数据在平均数加减3个标准差的范围之内 l根据经验法则,对于对称分布,几乎所有数据的标准化值都在区间(3,+3)内,则标准化值在区间外的数据都可以看作是异常值。3-60STAT 9名员工月工资收入的经验法则3-61STATl如果一组数据不是对称分布,经验法则就不再适用,这时可使用契比雪夫不等式,它对任何分布形状的数据都适用。l契比雪夫定理契比雪夫定理的内容:在任意一个数据集中,至少有1-1/z2的数据与平均数的距离在z个标准差之内,其中z是大于1的任意值。l契比雪夫不等式提供的是“下界
23、”,也就是“所占比例至少是多少”。3-62STAT对于z=2,3,4,该不等式的含义是l当z=2时,则至少有75%的数据与平均数的距离在2个标准差之内,即:至少有75%的数据落在平均数加减2个标准差的范围之内。l当z=3时,则至少有89%的数据与平均数的距离在3个标准差之内,即:至少有89%的数据落在平均数加减3个标准差的范围之内。l当z=4时,则至少有94%的数据与平均数的距离在4个标准差之内,即:至少有94%的数据落在平均数加减4个标准差的范围之内。l运用契比雪夫定理可以估计在均值的特定范围之内数据的个数。3-63STAT已知50名移动大客户移动话费的均值是546.98元,标准差117.37元,那么大概有多少个移动大客户移动话费在347747元之间?解解:根据契比雪夫定理计算 z=(747546.98)/117.37=1.71-1/z2=0.6556即略有33名移动大客户的话费在347747元之间。3-64STAT1.总量指标与相对指标总量指标与相对指标 2.分布集中趋势测度分布集中趋势测度3.分布离散程度测度分布离散程度测度4.分布偏态与峰度测度分布偏态与峰度测度5.数据的标准化数据的标准化3-65STAT