第三章-统计数据处理课件.ppt

上传人(卖家):三亚风情 文档编号:3164974 上传时间:2022-07-26 格式:PPT 页数:107 大小:1.48MB
下载 相关 举报
第三章-统计数据处理课件.ppt_第1页
第1页 / 共107页
第三章-统计数据处理课件.ppt_第2页
第2页 / 共107页
第三章-统计数据处理课件.ppt_第3页
第3页 / 共107页
第三章-统计数据处理课件.ppt_第4页
第4页 / 共107页
第三章-统计数据处理课件.ppt_第5页
第5页 / 共107页
点击查看更多>>
资源描述

1、经济管理类专业应用型本科教材统 计 学 电子工业出社出版 主编 杜家龙第三章 统计数据处理 教学目的 了解统计数据处理的意义、内容和程了解统计数据处理的意义、内容和程序,掌握统计数据分组、编制变量数列、序,掌握统计数据分组、编制变量数列、制作统计表、统计图的方法和技术。能够制作统计表、统计图的方法和技术。能够应用数据处理技术对客观现象的数量特征,应用数据处理技术对客观现象的数量特征,作出基本的统计描述。作出基本的统计描述。重点难点 统计数据预处理,统计分组、编制变统计数据预处理,统计分组、编制变量数列,制作统计表和统计图。量数列,制作统计表和统计图。第一节统计数据处理概述 一、统计数据处理的概

2、念和内容(一)统计数据处理的意义统计数据处理就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。统计数据处理,是统计由对个别现象的认识上升到对总体现象认识的一个重要阶段,在统计研究工作中起着承先启后的作用,它既是数据搜集的继续和深化,又是数据分析的基础和前提。(二)数据处理的原则和内容 1.数据处理的原则 统计数据处理必须遵循目的性、联系性和简明性三原则。统计数据处理原则目的性原则联系性原则简明性原则2.2.2.统计数据处理的内容统计数据处理的内容统计数据处理的内容统计数据处理的内容统计数据处理的内容统计数据处理的内容确定指标确定指标和分组

3、和分组原始数据原始数据预处理预处理汇总计算汇总计算各指标各指标编制统编制统计表计表系统积累系统积累统计数据统计数据第一,根据统计研究的目的和要求,确定应该计算的指标,并根据分析的需要确定具体的分组;第二,对大量的原始数据进行预处理;第三,对各指标进行汇总,计算出各组单位数、总体单位数以及各组或总体的有关标志值之和;第四,将汇总处理的数据编制成统计表;第五,对统计数据进行系统积累。(三)统计数据预处理 1.数据的审核与筛选 对于通过直接调查取得的原始数据,应主要从完整性和准确性两个方面去审核。完整性审核主要是检查应调查的单位或个体是否有遗漏,所有的调查项目或指标是否填写齐全等。统计数据预处理筛选

4、审核订正排序 准确性审核主要包括两个方面:一是检查数据资料是否真实地反映了客观实际情况,内容是否符合实际;二是检查数据是否有错误,计算是否正确等。审核数据准确性的方法主要有逻辑检查和计算检查。逻辑检查主要是从定性角度审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象。计算检查是检查调查表中的各项数据在计算结果和计算方法上有无错误。对于第二手数据,除了对其完整性和准确性进行审核外,还应着重审核数据的适用性和时效性。首先应弄清楚数据的来源、数据的口径以及有关的背景材料,以便确定这些数据是否符合分析研究的需要,是否需要重新加工处理等。此外,还要对数据的时效性进行审核,一般来说,应

5、尽可能使用最新的统计数据。2.数据的订正 第一,对可以肯定的一般错误,即代为更正,并向有关单位核对;第二,对可疑之处或无法代为更正的错误,通知原报单位复查更正;第三,对在个别单位发现的有代表性的重大差错,除通知原报单位更正外,还要通报尚未报送资料的单位,以防止类似错误的发生;第四,对于违反统计法规的,应查明责任,予以适当处理。3.数据的排序 数据排序就是按照一定的顺序将数据排列,以便初步显示数据的一些明显特征和规律,为研究者找到解决问题的线索。此外,排序还有助于对数据的检查纠错,为分组、汇总提供依据。第二节 统计分组 一、统计分组的概念和性质 统计分组的概念 统计数据分组是指根据统计研究的目的

6、和要求,将总体单位或全部数据按照一定的标志划分成若干类型(组),使组内的差异尽可能小,组间的差别尽可能明显,从而使大量无序的、混沌的数据变为有序的、反映总体特征的资料。统计分组的特性 首先,统计分组具有分与合的双重功能,是分与合的对立统一;其次,统计分组的目的是要在同质性的基础上研究总体的内在差异性;第三,统计分组在体现分组标志的组间差异的同时,却可能掩盖了其他标志的组间差异,因此,统计分组存在一定的局限性;第四,统计分组的关键是选择分组标志和划分各组界限。二、统计分组的主要作用 1.划分现象的不同类型 统计分组的最基本作用,就是把复杂自然或社会现象划分为各个性质不同的组成部分,以认识事物质的

7、差别。例如,把社会产品划分为生产资料和消费资料;将国民经济划分为第一产业、第二产业和第三产业等。2.反映总体的内部结构 在统计分组基础上,计算各部分占总体的比重可揭示总体内部结构,表明总体中各部分与整体以及各部分之间存在的数量关系,从而反映事物的构成特征和性质。通过比较总体内部结构的动态变化还可以揭示现象发展变化过程和规律。3.分析现象之间的依存关系 客观现象之间存在着广泛的相互依存关系,根据研究目的,按照一定标志对总体进行分组,然后观察与分组标志相关标志的其它标志的数量变化,可揭示相关事物之间的数量依存关系。如农作物的耕作深度与收成率之间的关系、家庭收入与生活费支出之间的关系、市场商品价格与

8、其需求量之间的关系等等,都可以通过统计分组来研究。三、统计分组的类型 统计数据分组按反映研究对象的特点和分组的形式分类主要有以下类型。(一)按照分组标志的性质不同,可将统计分组分为属性分组与变量分组。1.属性分组 属性分组是按照反映事物属性的品质标志进行的分组。例如,人口按性别、民族、文化程度、职业、婚姻状况等标志分组,工业企业按经济类型、行业、地区等标志分组。2.变量分组 变量分组是指按照数量标志进行的分组。变量分组的组限是指各种不等的变量值。例如,把工业企业按生产能力分为:10亿元以下、10100亿元、100亿元以上三个组,把学生总体按爱好学科数分为1个、2个、3个、3个以上等组。(二)简

9、单分组、复合分组与分组体系 按照分组标志的多少和分组的形式不同,可将统计分组分为简单分组、复合分组与分组体系。1.简单分组 所谓简单分组,就是将总体按一个标志进行的分组。这种分组只能从某一方面去说明总体特征。例如,某地工业企业按规模分组就是一个简单分组:国有企业集体企业股份合作企业联营企业 2.复合分组 复合分组是按照两个或两个以上的标志,重叠起来对总体进行分组。这里所谓重叠,是指在前一次分组结果的内部再进行下一次分组。例如,某地工业企业先按规模标志、再按所有制标志所进行的复合分组;某高校教师按职务、年龄和性别分组。国营经济大型企业 私营经济 其他经济 国营经济中型企业 私营经济 其他经济 国

10、营经济小型企业 私营经济 其他经济 高校教师的复合分组第一标志(职务)第一标志(职务)第二标志(年龄)第二标志(年龄)第三标志(性别)第三标志(性别)高级职称(教授、副教授)45岁以上男女45岁以下男女非高级职称(讲师、助教)45岁以上男女45岁以下男女 3.分组体系 分组体系是按照两个或两个以上相互联系、相互补充的标志,对被研究对象进行平行分组所形成的体系。分组体系可以从不同角度、不同方面对某一现象作出比较全面的说明。例如,我国2009年国民经济和社会发展统计公报中的人口构成统计表(公报表15),就是一个分组体系。表3.1 我国2009年人口数及其构成指标年末人数(万人)比重(%)全国总人口

11、其中:城镇 乡村其中:男性 女性其中:014 1459 60岁及以上 其中:65岁及以上133474621867128868652648222466392097167141130910046.653.451.448.618.569.012.58.5 四、统计分组方法等距分组等距分组不等距分组不等距分组单项式分组单项式分组组距式分组组距式分组分组方法分组方法按品质标志分组按品质标志分组按数量标志分组按数量标志分组 (一)按品质标志分组 按品质标志分组又分简单品质分组和复杂品质分组两种情况。1.简单的品质标志分组 简单的品质分组是指分组标志一经确定,组的名称和组数也就随之确定,而且各单位应分在哪一

12、组也比较明确,不存在组与组之间界限区分困难的分组。例如,人口按性别分为男、女两组,具体到每一个人应该分在哪一组是一目了然的。2.复杂的品质标志分组 复杂的品质分组是指分组标志选定以后组间界限不易划分,存在交叉过渡形态,总体中的各单位归并于何组比较困难的统计分组。为保证各种统计分类的科学性、统一性和完整性,便于各部门掌握和使用,通常由国家统计局会同有关部门制定统一分类目录,在全国范围内实行。如国民经济行业分类目录、商品分类目录等。(二)按数量标志分组 1.数量标志分组的意义 按数量标志分组是指选择反映事物数量差异的数量标志,根据其变异范围区分各组界限,将总体划分为若干个性质不同的组成部分。例如,

13、研究居民家庭贫富状态时,按恩格尔系数(即食品类支出占整个居民家庭消费支出的比重)分组,将其在60以上的划分为贫困家庭;5060的为温饱家庭;4050为小康家庭;40以下的为富裕家庭。2.数量标志分组的方式 根据总体各单位某一数量标志值的变动特征,可供选择的分组方式有单项式分组和组距式分组两种。(1)单项式分组 单项式分组是指按每一个具体变量值对现象总体所进行的分组。如某班学生按年龄分组(见表3.2)。表3.2 某班学生按年龄分组表按年龄分组(岁)人数(人)比例()1718192021510209610.0020.0040.0018.0012.00合计50100.00 单项式分组一般适用于离散型

14、变量,且变量值不多、变动范围较小的情况。(2)组距式分组 组距式分组是指按变量值的一定范围对现象总体所进行的分组。在现象总体的变动范围内,将其划分为若干个区间,各区间内的所有变量值作为一组,其性质相同,组与组之间的性质相异。例如,某校学生家庭收入分组情况统计表就是一个组距式分组表(见表3.3)。组距式分组一般在变量值变动幅度较大的条件下采用。在组距式分组中,涉及到组限、组距、组数、组中值等分组要素。表3.3(a)某校学生家庭收入分组统计表按年收入分组(万元)学生数(人)占总户数比例()3以下34455667788以上90025104360289014406506306.718.832.621.

15、610.84.94.7合计13380100.0表3.3(b)某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)110以下110115115120120125125130130135135以上358141064610162820128合计50100 组限组限是用来表示各组之间界限的变量值,是决定事物质量的数量界限。其中,在每一组中最小的变量值为下组限,简称为下限;最大的变量值为上组限,简称为上限。组距式分组中有重叠式组限和非重叠式组限两种组限表示方法。组距组距是指一组变量值的区间长度,也就是每一组的上限与下限之间的距离。即:组距上限下限。组数组数即分组个数。组中值组中值即组距的中

16、点数值,它是各组变量值的代表水平。2下限上限2后一组下限本组下限邻组组距上限重合式组限组的组中值非重合式组限组的组中值缺下限组的组中值邻组组中值邻组组距缺上限组的组中值2邻组组距下限 邻组组中值十邻组组距 五、统计资料的再分组 统计资料的再分组是指把统计分组资料按某种要求重新划定各组界限,再将资料中的单位数或比重分布做出相应的调整。例如,表3.4所示某工业部门劳动生产率的分组资料与研究目的不一致,主要是组数多、组距小,不利于简明地观察问题,需要进行再分组。表3.4某工业部门劳动生产率分组表组号按劳动生产率分组(千元/人)企业数比例(%)职工数比例(%)总产值比例(%)123456789106以

17、下677889910101111121213131414以上11141015209124236.209.4810.7816.2620.0012.9311.545.402.694.729.6612.8313.0016.7819.1210.989.043.821.842.93合 计100100.00100.00 为了与相邻地区同行业的同类指标进行比较,将企业的劳动生产率重新划分为四组,即:人均产值在12.5千元以上的为优秀企业;1012.5千元之间的为良好企业;7.510千元之间的为一般企业;7.5千元以下的为后进企业。其再分组的结果如表3.5所示:表3.5某工业部门劳动生产率再分组表组别按劳动生

18、产率分组(千元/人)企业数比例(%)职工数比例(%)总产值比例(%)ABCD7.5以下7.5101012.512.5以上304023721.0741.6527.1710.1128.9942.4021.93 6.68合 计100100.00100.00 表3.5再分组的步骤如下:第一步 确定再分组的各自范围。即A组包括原第1组、第2组的全部和第3组的一部分;B组包括原第3组的一部分和第4组、第5组的全部;C组包括原第6组、第7组的全部和第8组的一部分;D组包括原第8组的一部分和第9组、第10组的全部。第二步 计算新组各自相连组的比例。可用相连组的部分组距除以相连组的组距之和而求得。其具体计算过程

19、为:如A组在相连组中所占比例0.70.80.75.7B组在相连组中所占比例10.50.5同理C组在相连组中所占比例0.5,D组在相连组中所占比例0.50.5 第三步 确定再分组的对应单位数。即计算各组变量值的区间范围所对应的单位数(此处为企业数比例、职工数比例和总产值比例)。其具体计算过程为:A组企业数比例=1114100.5=30%,用同样方法可得到B组为40,C组为23,D组企业数比例为7。职工数比例和总产值比例的各组对应数可按上述计算过程类推,其结果见表3.5。第三节 频数分布一、频数分布的概念 在分组的基础上,把所有数据或总体单位按组归并、排列,形成所有数据或总体各单位在各组间的分布,

20、称为频数分布,又称为分布数列。例如表3.6是我国2009人口按城乡分组形成的频数分布。表3.6 2009年末我国大陆人口的城乡分布按性别分组人口(万人)f构成(%)f/f总人口城镇乡村1334746218671288100.0 46.6 53.4二、频数分布的种类频数分布按分组标志和分组形式的不同可分成如下类别:频数分布变量分布单项式频数分布组距式频数分布 品质分布等距式分布异距式分布图3.1 频数分布的种类 ()品质频数分布 品质频数分布,简称为品质数列,它是经过属性分组后形成的频数分布,其组别表现为一系列的概念或范畴,如表3.6所示。(二)变量频数分布 变量频数分布,简称为变量数列,它是经

21、过变量分组后形成的分布数列,其组别表现为不同的数值或数域。变量数列又分为单项数列和组距数列。1.单项数列 单项数列是以一个变量值为一组编制的变量频数分布,如表3.7就是一个单项数列。对离散型变量,且变量值项数较少、变动范围较小时,可编制单项数列反映其分布状况。表3.7某高校在校学生年龄分布按年龄分组(岁)学生人数(人)f比重(%)f/f171819202122235418922828313197245.418.822.728.113.0 9.6 2.4合 计1006100.0 2.组距数列 组距数列是以表示一定变动范围的两个变量值构成的组所编制的变量频数分布,如表3.8就是一个组距数列。对于连

22、续型变量或项数较多、变动范围较大的离散型变量,需要用组距数列去反映其分布情况。表3.8某集团公司职工分组表按月工资分组(元)职工人数(人)f比重(%)f/f2000以下20002100210022002200230023002400240025002500以上5072105487368121594.05.78.338.629.29.64.6合 计1262100.0三、累计频数和累计频率 累计频数和累计频率是将变量频数分布中各组频数或频率依次累加而得到的各组累计频数或累计频率。累计的方法有两种:一是向上累计,即将各组频数或频率由变量值低的组依次向变量值高的组累计,它表明从第一组下限开始到本组上限

23、为止的累计频数或累计频率;二是向下累计,即将各组频数或频率由变量值高的组依次向变量值低的组累计,它表明从最末一组的上限开始到本组下限为止的累计频数或频率。如表3.9。表3.9某集团公司职工基本工资分组表按月工资分组(元)职工人数(人)比重(%)向上累计向下累计人数比重%人数比重2000以下20002100210022002200230023002400240025002500以上5072105487368121594.05.78.338.629.29.64.6501222277141082120312624.09.718.056.685.895.4100.0126212121140103554

24、818059100.096.090.382.043.414.24.6合 计1262100.0四、组距式变量数列的编制 组距式变量数列的编制过程则比较麻烦,从外在形式上看,它要做确定分组标志、确定组距和组数、确定组限等一系列工作。从本质意义上看,它要通过科学分组(正确确定组数和组距)去反映总体各单位在某一数量标志上的分布特点和规律,进而认识总体的特征、构成和性质。下面,我们通过实例说明组距式变量数列的编制程序和过程。例3.1 某班学生高等数学考试成绩资料如表3.10所示,试据此数据编制适当的组距数列,以反映学生成绩分布状况。表3.10 某班学生高等数学考试成绩(单位:分)97 55 84 63

25、57 52 74 76 56 5960 62 62 85 56 77 63 86 73 6799 94 53 78 92 97 64 86 62 6664 59 75 74 95 96 78 84 82 9681 96 95 64 97 92 68 82 77 71 考试成绩属于连续型变量,故应编制组距数列。其编制过程为:(1)将原始数据按大小顺序排列,并确定最大值、最小值和全距。其结果如下:将数据从小到大排列表3.11 某班学生高等数学考试成绩排序(单位:分)52 57 62 64 71 76 81 85 94 9653 59 62 64 73 77 82 86 95 9755 59 63

26、66 74 77 82 86 95 9756 60 63 67 74 78 84 92 96 9756 62 64 68 75 78 84 92 96 99 求最大值、最小值和全距 最大值99,最小值52,全距最大值最小值995247 (2)确定组距数列类型。由于考试成绩分布比较均匀,在近50分的变动范围内,平均来说是以1分为幅度逐渐变动的,故可编制等距数列。(3)确定组数和组距。等距数列组距=全距组数。确定组数和组距时,一般应遵循以下几条原则:考虑到组距内的同质性。本例中必须将及格与不及格的质的界限体现出来,不能分成4555、5565、。要能反映总体分布规律,即要体现原始数据分布的集中趋势或

27、离中趋势。组距不能太大或太小。经验表明,组数一般应在515组内,组距最好是5的整数倍数。当数据项数较多时分组可适当多一些,数据项数较少时分组可以适当少一些。本例数据项数较少,因此组数应少一些,故可考虑分为5组。在等距数列情况下,如果总体单位数不是很多,变量变动范围不是很大时,可用斯特吉斯(HASturges)经验公式计算出一个参考组距。公式为:将表3.11资料代入公式,(分)。考虑到组距一般为5的整数倍,可定组距为10分。NRilg322.31750lg322.3147i (4)确定组限和组限的表示法 确定组限应遵循以下几条原则:最小组下限低于或等于最小变量值,最大组上限应大于最大变量值;如果

28、有极端值,可用开口组;组限应有利于表现总体单位分布规律;对于等距数列,如果组距是5的倍数,则每组下限也最好是5的倍数。此外,还应确定组限用同限(重叠式)还是用异限(非重叠式)。因为考试成绩从本质上说是连续变量,为避免遗漏,采用同限表示。但本例中考试成绩取整数,故既可用同限,也可用异限。选用同限,则组限可分为五个组:60分以下60707080809090100 (5)从最小组起依次排列,并分别计算各组频数和其他有关指标,形成分组统计表(见表3.12)。按考分分组(分)学生人数(人)比重()60以下607070808090901008121081216.0024.0020.0016.0024.00

29、合计50100.0表3.12 某班学生高等数学考试成绩分组表 五、频数(次数)分布的类型 客观现象的频数(次数)分布主要有钟形分布、U形分布和J形分布三种类型。图3.2 次数分布类型 ()钟形分布 钟形分布是指靠近两端的变量值分配次数较少,中间变量值则分配次数较多,绘制成的曲线图形状宛如一口古钟的次数分布(见图3.1)。钟形分布是最常见的分布,其突出特征是“中间大,两头小”。如果钟形分布的中间变量值次数最多,两侧变量值分配的次数随着其与中间变量值距离的增大而渐次减少,并围绕中心变量值两侧呈完全对称分布,则称为对称分布。对称分布中的正态分布是最重要的分布,许多客观现象总体都趋近于正态分布。中心变

30、量值两侧的变量值次数分布不对称的称为非对称分布或偏态分布,通常有左偏态和右偏态两种。(二)U形分布 U形分布的特征与钟形分布特征恰恰相反,靠近中间的变量值分布次数少,靠近两端的变量值分布次数多,分布特征是“两头大,中间小”。绘成的曲线图形如英文字母“U”。例如,人口在不同年龄上的死亡率一般近似地表现为U形分布。(三)J形分布 J形分布有正反两种情况:次数随变量值增大而增多时所绘成的曲线图形如英文字母“J”,称为正J形分布;次数随变量增大而减少时所绘成的曲线图犹如反写的英文字母“J”,称为反J分布。例如,商品供给量随着价格的提高而不断增加,使供给曲线呈正J分布;人口总体按年龄大小的分布一般呈反J

31、形分布。第四节统计表和统计图一、统计表 (一)统计表的概念和构成 所谓统计表,就是由纵横交叉的线条所组成的用于显示统计数据的表格。统计表由总标题、横标目、纵标目和统计数字四个要素构成 总标题中国国内生产总值1992年1993年金 额(亿元)比 重()金 额(亿元)比 重()速度()(92为100)国内生产总值24363100.031380100.0113.4第一产业580023.8665021.2104.0第二产业1170048.01624551.8120.4第三产业686328.2848527.0109.3题标栏纵值数标指题标行横 总标题是统计表的名称,用以概括说明整个表的内容,一般位于表的

32、上方中央;横标目是横行内容的名称,代表统计所要说明的对象,也称为主词,一般列在表的左边;纵标目是纵栏内容的名称,是用来说明主词情况的统计指标,也称为宾词,一般列在表内的上方;统计数字是各项指标的具体数值,内容由横标目和纵标目所限定。填表说明,一般表下附有资料来源、指标计算方法、填报单位、填表人、填表日期等说明。(二)统计表的分类 在统计研究中通常按作用、反映对象的特点和分组情况对统计表进行分类。1.调查表、汇总表和分析表 统计表按作用不同可以分为调查表、汇总表和分析表。调查表是在统计调查中用于登记、搜集原始资料的表格;汇总表是用于统计资料整理、汇总的表格;分析表是用于统计分析的表格。2.空间数

33、列表和时间数列表 统计表按所反映统计数列的时空性质不同,可以分为空间数列表和时间数列表。空间数列表又称静态表,是反映同一时间条件下不同空间范围内的统计数列的表格,它可以说明现象在不同空间内数量分布状态。时间数列表又称动态表,是反映同一空间条件下不同时间上的统计数列的表格,它可以说明在既定的空间范围内现象在不同时间上的变动过程。时空间数结合表,指将时间数列和空间数列结合起来编制的统计表。3.简单表、分组表和复合表 统计表按对总体分组的情况不同,可以分为简单表、分组表和复合表。简单表是指对总体未做任何分组,仅按单位名称或时间顺序排列而成的统计表。分组表又称简单分组表,是对总体的统计单位按一个标志进

34、行分组而形成的统计表。复合表又称复合分组表,是对总体的统计单位按两个或两个以上的标志进行交叉重叠分组,或按每一标志单独分组平行排列而形成的统计表。(三)统计表的编制规范 设计和填写统计表时必须遵循以下规范要求。(1)统计表的标题、项目、指标要简明扼要,能准确反映内容,使人一目了然,便于分析。如果指标的计量单位只有一个,则通常列在表的右上角,如果计量单位较多,则列在相应的指标栏内。(2)统计表的纵栏、横行的排列要尽量反映出内容方面的逻辑关系。(3)当统计表的栏目较多时,可编号说明其相互关系。主词栏和计量单位栏常用甲、乙、丙等文字编号,宾词栏常用1、2、3等数字编号。(4)表中的合计栏可以排在前面

35、,也可以排在最后,如果只列出其中部分项目,则合计栏必须排在前面。(5)表中的统计数字要根据纵横关系对位,数字为零时要写出“0”来,不应填写数字的空格用“”线表示;未发生的数字空着不填;估算的数字应在表下说明;无法取得的资料用“”号表示;如果某项数字与邻项数字相同,则仍应填写数字,不得用“同上”、“同左”等字样或符号代替。(6)表的上下两端用粗线,左右两边不封口,纵栏之间用细线分开,横行之间可以不加线。如果横行过多,也可以每五行加一细线。(7)统计表的资料来源及其他需要说明的问题可在表下加以注明。二、统计图 用来表现统计数据的各种几何图形、具体事物的形象、符号等都叫统计图。用统计图来显示统计数据

36、,具有直观、生动、形象、易懂的优点。统计图没有冗长的数据和呆板的表格形式,易为一般人接受和理解。不同的统计图,绘制方法不同,但都必须遵守如实反映、便于比较、通俗易懂、鲜明醒目、灵活机动原则。常用统计图可作如下分类:常用统计图数据类型数据类型定性数据定性数据定量数据定量数据条形图条形图圆形图圆形图折线图折线图雷达图雷达图直方图直方图曲线图曲线图 (一)直方图和条形图 1.直方图 直方图是用矩形的宽度和高度来表示频数分布的图形。在平面直角坐标系中,横轴表示数据分组,纵轴表示频数或频率,这样各组与相应的频数就形成了一个矩形,即直方图。如根据表3.14可绘制成直方图如图3.3。表3.14 我国2000

37、年至2009年国内生产总值 单位:万元 年份20002001200220032004总产值89442109655120333135823159878年份20052006200720082009总产值184937216314265810314045335353图3.3 直方图例:某企业职工月生活费支出表生活费支出(元)职工数(人)比重(%)200以下 20 20200-400 50 50400-600 20 20600-800 10 10合计 100 100职工生活费支出直方图 2.条形图 条形图是用宽度相同的条形的高度或长度来表示数据变动的图形。条形图可以横置和纵置,纵置时也叫柱形图。如根据表

38、3.15资料绘制条形图如下(见图3.4):表3.15 2009年我国对主要国家和地区出口额统计表 单位:亿美元国家/地区欧盟美国中国香港东盟日本出口金额 2363220816621063979国家/地区韩国印度中国台湾俄罗斯出口金额 537297205175图3.4 条形图 (二)折线图和曲线图 1.折线图 折线图也称频数多边图,它是在直方图的基础上把相邻直方形的顶边中点连接成一条折线,再把拆线两端与横轴上直方形两侧延伸的假想组中点相连,就形成了频数分布折线图。折线图也可以用组中值与次数求坐标点连接而成。例如,根据表3.14可绘制如下折线图(见图3.5)。图3.5 频数分布折线图 2.曲线图

39、曲线图是用曲线的升降起伏来表示被研究现象的变动情况及其趋势的图形。曲线图根据所示数据的性质和作用不同,可分为频数分布曲线图、动态曲线图和依存关系曲线图。在频数分布折线图的基础上,当变量数列的组数无限增多时,折线图便近似地表现为一条平滑的曲线,折线图就变成了频数分布曲线图。例如,根据表3.16资料,可绘制出图3.6所示频数分布曲线图。图3.6 频数分布曲线图 (三)圆形图和环行图 1.圆形图 圆形图是以圆的面积或圆内各扇形的面积来表示数值大小或总体内部结构的一种图形。根据作用不同,可分为圆形比较图、圆形结构图和圆形结构比较图。我们主要介绍圆形结构图。圆形结构图通过圆内各扇形的面积来反映总体中各组

40、成部分所占的比例。绘制圆形结构图的关键是正确计算各扇形的面积。由于在相同半径条件下,扇形面积与圆心角成正比,且圆心角度数为360,故各扇形的中心角度为3600各组频率。例如,根据2003年公布的我国第二次基本单位普查统计资料(见表3.17),企业法人占 59.2,那么扇形的中心角度数应为360o59.2213.120。依此类推,我们可绘制圆形结构图如图3.7所示。表3.17 我国法人单位按单位类别分组统计表按单位类别分组单位数(万个)比重(%)企业法人302.659.2机关、事业法人102.620.1社会团体法人10.62.1居(村)委会79.215.6其他法人15.73.0合计510.710

41、0.0图3.7 圆形结构图 2.环形图 环形图中间有一个“空洞”,总体中的每一个部分数据用环中的一段表示。环形图可以同时绘制多个总体的数据系列,每一个数据系列为一个环,可以显示多个总体各部分所占的相应比例,从而有利于进行比较研究。设甲、乙两个教学班学生对某门课程教学评价资料如表3.18所示,据此资料作环形图如图3.8所示。表3.18 课程教学情况评价表班别很不满意不满意一般满意很满意甲班2%5%20%50%23%乙班5%10%30%40%15%图3.8 环形结构比较图 (四)雷达图 这种图形既象雷达荧光屏上看到的图象,也象个蜘蛛网,因此也有人称为蛛网图。设有n组样本S,S,Sn,每个样本测得P

42、个变量Xl,X,Xp,共计np个观测值。要绘制这P个变量的雷达图,其具体做法是:先画一个圆并将圆P等分,得到P个点,让这P个点对应P个变量,再将这P个点与圆心连线,得到P个辐射状的半径,这P个半径分别作为P个变量的坐标轴,每个变量值的大小用由半径上的点到圆心的距离表示,将同一个样本的值在P个坐标上的点用线段连接,这样n个样本形成的n个多边形就是一个雷达图。例如,2002年至2008年我国农村居民消费支出构成资料如表3.19 所示,据表中资料可作图3.9所示雷达图。表3.19 我国居民消费支出构成变化分析()项 目199820022008合 计食品消费衣着消费居住消费用及服务性消费10053.4

43、15.16.225.310046.516.45.731.410043.718.55.832.0图3.9雷达图 雷达图显示,1998年到2002年我国农村居民生活消费结构发生了较大变化,食品支出比重有较大下降,而用及服务性支出比重则有较大提高。2002年到2008年,消费结构得到进一步改善。同时我们也可以看到,我国农村居民消费支出模式10年来基本相同,这可从雷达图的形状看出。在消费支出中,食品支出是第一位的,食品和用及服务性支出二者占了消费支出的绝大比重,衣着和居住支出占比重很小。本章小结 统计数据处理是根据统计研究目的,统计数据处理是根据统计研究目的,对统计调查所得的原始资料进行科学的分类、对

44、统计调查所得的原始资料进行科学的分类、汇总,或对已初步加工的资料进行再加工,汇总,或对已初步加工的资料进行再加工,使之成为系统化、条理化的综合资料,以反使之成为系统化、条理化的综合资料,以反映现象总体特征的工作过程。其内容包括对映现象总体特征的工作过程。其内容包括对资料的审核、分组、汇总和编制统计图表等资料的审核、分组、汇总和编制统计图表等几个主要环节。几个主要环节。数据处理的关键是统计分组,统计分组就数据处理的关键是统计分组,统计分组就是根据统计研究的需要,按照一个或几个重要是根据统计研究的需要,按照一个或几个重要的标志,将统计总体划分为若干个组成部分。的标志,将统计总体划分为若干个组成部分

45、。通过统计分组可以划分现象的类型、反映通过统计分组可以划分现象的类型、反映现象总体的构成状况、揭示现象间的依存关系。现象总体的构成状况、揭示现象间的依存关系。统计分组有品质标志分组和数量标志分组两种。统计分组有品质标志分组和数量标志分组两种。按数量标志分组又有单项式分组和组距式分组按数量标志分组又有单项式分组和组距式分组两种。组距式分组要确定好组限、组距和组数两种。组距式分组要确定好组限、组距和组数等。等。频数分布是在统计分组的基础上形成的频数分布是在统计分组的基础上形成的反映总体单位在各组中分布状况的统计数列。反映总体单位在各组中分布状况的统计数列。它有品质数列和变量数列两种。变量数列可它有

46、品质数列和变量数列两种。变量数列可以编制成次数分布表和分布图。以编制成次数分布表和分布图。次数分布主要有钟形分布、次数分布主要有钟形分布、U形分布和形分布和J形分布三种类型。形分布三种类型。统计表是把统计数据按照一定的结构顺统计表是把统计数据按照一定的结构顺序,用表格显示的一种形式。统计表由总标序,用表格显示的一种形式。统计表由总标题、横标目、纵标目和统计数字等四个基本题、横标目、纵标目和统计数字等四个基本要素构成。编制统计表必须注意规范要求。要素构成。编制统计表必须注意规范要求。统计图是借助几何图形或具体形象显示统计图是借助几何图形或具体形象显示统计数据的一种形式。常用的有直方图、条统计数据的一种形式。常用的有直方图、条形图、折线图、曲线图、圆形图和雷达图等。形图、折线图、曲线图、圆形图和雷达图等。本章讲授结束。本章讲授结束。再见!再见!

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第三章-统计数据处理课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|