统计学第三章课件.ppt

上传人(卖家):三亚风情 文档编号:3225118 上传时间:2022-08-08 格式:PPT 页数:115 大小:10.66MB
下载 相关 举报
统计学第三章课件.ppt_第1页
第1页 / 共115页
统计学第三章课件.ppt_第2页
第2页 / 共115页
统计学第三章课件.ppt_第3页
第3页 / 共115页
统计学第三章课件.ppt_第4页
第4页 / 共115页
统计学第三章课件.ppt_第5页
第5页 / 共115页
点击查看更多>>
资源描述

1、统 计 学第三章 统计数据的整理与显示 统计与统计学的产生和发展第一节统计分组与分配数列第二节 统计数据的显示第三节 SPSS软件在数据统计中的应用第四节 学习目标学习目标1.了解统计数据整理与显示的基本内容;2.掌握选择分组标志、编制变量数列、制作基本统计图表的技术和方法;3.掌握各种不同类型资料的整理方法、整理原则及相关概念;4.能够利用所学的方法对所给的实际资料按照研究目的的要求进行整理。第三章 统计数据的整理与显示0101一、统计数据的整理 统计数据的整理是统计工作的第三个阶段,在整个统计工作过程中起着承前启后的作用,它既是统计调查的继续和深化,又是统计分析的基础和前提,是统计调查和统

2、计分析的连接点。一、统计数据的整理 一、统计数据整理的概念和意义 统计数据整理简称统计整理,是指根据统计研究的目的和任务,对统计调查所得的原始资料进行科学的分类和汇总;或者对已初步加工的次级资料进行再加工,使其系统化、条理化、科学化,以反映所研究现象总体特征的工作过程。一、统计数据的整理 统计调查得到的大量的、零散的、不规范的资料,只能表明被调查单位的具体情况,反映事物的表面现象,不能说明事物的综合情况,必须对其进行加工整理。一、统计数据的整理 【例3-1】李明亮的计算机成绩是68分,这只能说明他个人的成绩,代表不了班级。而班级的平均成绩需要汇总再平均才能知道,这一过程需要将班级全部学生的成绩

3、加以整理分析。一、统计数据的整理 因此,统计整理是实现由对个别现象到总体现象的认识,统计整理的正确与否、质量好坏,将直接影响统计对社会经济现象数量描述的准确性和数量分析的真实性。采用科学的方法进行统计整理是顺利完成统计分析任务的前提。一、统计数据的整理 统计整理方案是根据统计研究的目的和要求,事先对整个工作做出的全面的计划和安排。其主要内容包括确定汇总的指标与综合统计表,确定分组方案,选择资料汇总形式,确定资料审查的内容与方法,确定与历史资料的衔接方法,对整理各工作环节做出时间安排和先后顺序安排,等等。统计整理方案是保证统计整理工作按时、按质、按量完成的指导性文件,方案设计是否合理直接关系到统

4、计整理工作的质量,因此,要做到慎重、周密。二、统计数据整理的概念和意义制定统计整理方案制定统计整理方案1.一、统计数据的整理审核调查资料审核调查资料2.(1)审核调查资料的准确性主要有逻辑性审核和计算审核两种。逻辑性审核是利用逻辑理论检查调查资料的内容是否符合客观实际,调查表或报表中的内容是否合理,各项目之间有无矛盾之处,并与有关资料进行对照,从中发现逻辑上的矛盾。计算审核是利用平衡或加总关系审核调查表或报表中的各项数字在计算方法和结果上有无差错,计量单位有无与规定不符的地方,等等。发现调查资料数据有差错后,要分不同情况及时进行纠正和处理:属于填报错误的,要通知填表人或填报单位重新填报;属于汇

5、总错误的,应根据情况予以修正。一、统计数据的整理 (2)审核调查资料的及时性,就是审核调查资料是否按规定的时间报送,如未按规定时间或未及时报送要检查其原因。(3)审核调查资料的完整性,就是审核所有被调查单位的调查资料是否齐全,是否有重复和遗漏;另外,还要审核调查表中应填写的项目是否填写齐全。因为任何单位不报资料或缺报资料都会影响整个汇总工作的正常进行。一、统计数据的整理对调查资料进行分组、汇总和计算对调查资料进行分组、汇总和计算3.根据统计整理方案的要求,按已确定的汇总形式和具体方法,依照一定标志,对调查资料进行分组。按分组的要求,对各项数字进行汇总,计算分组单位数、总体单位数、分组标志总量和

6、总体标志总量。在统计整理过程中,对大量的原始资料进行分组、汇总和计算是一项主要的工作。一、统计数据的整理审核汇总后的调查资料审核汇总后的调查资料4.(1)复计审核,即对每个指标数值进行复核计算。(2)表表审核,即审核不同统计表上重复出现的同一指标数值是否一致,审核统计表中互有联系的各个指标数值之间是否衔接和符合逻辑性。(3)表实审核,即将汇总得到的指标数值与了解的实际情况联系起来进行检查。(4)对照审核,即对某些统计、会计、业务三种核算都进行计算的指标数值,应进行相互对照检查,看数字是否相同,以便从中发现可能出现的错误。一、统计数据的整理编制统计表,绘制统计图编制统计表,绘制统计图5.把整理好

7、的统计资料用统计表或统计图的形式表现出来,简明扼要地表现社会经济现象在数量方面的具体特征和相互关系,具体操作将在后面详细介绍。一、统计数据的整理 三、频数分布的主要类型 由于社会经济现象的性质各不相同,因而频数分布也不尽相同。频数(次数)分布主要有钟形分布、J形分布和U形分布三种类型,如图3-1所示。图图3 3-1 1 频数分布的主要类型频数分布的主要类型一、统计数据的整理钟形分布钟形分布1.钟形分布是指靠近两端的变量值的分配次数较少,中间变量值的分配次数较多,绘制成的曲线宛如一口古钟。一、统计数据的整理 钟形分布是客观现象分布中最常见的分布,其分布特征是“中间大,两头小”。如果钟形分布的中间

8、变量值的分配次数最多,两侧变量值的分配次数随着其与中间变量值距离的增大而渐次减少,并在中心变量值的两侧呈完全对称分布,则称为对称分布,如学生成绩的分布、单位面积农产品产量的分布。一、统计数据的整理J J形分布形分布2.J形分布有正、反两种情况。次数随变量值增大而增多时所绘成的曲线如英文字母J,称为正J形分布;次数随变量值增大而减少时所绘成的曲线犹如反写的英文字母J,称为反J形分布。例如,商品的供给量随着需求的提高而不断增加,使供给曲线呈正J形分布;人口总体按年龄大小的分布一般呈反J形分布。一、统计数据的整理 U形分布的特征与钟形分布的特征恰恰相反,靠近中间的变量值的分配次数较少,靠近两端的变量

9、值的分配次数较多,分布特征是“两头大,中间小”。其绘成的曲线如英文字母U。例如,人口在不同年龄上的死亡率一般近似地表现为U形分布。U U形分布形分布3.02二、统计分组与分配数列 一、统计分组 统计整理的主要工作内容是对调查得到的资料进行分组、汇总和计算,其中,统计分组(statistical grouping)是最基本的,是保证分类、汇总科学合理的基础。二、统计分组与分配数列 统计分组的概念统计分组的概念1.统计分组是根据统计研究的目的和研究对象的特点,将统计总体按照一定的标志区分为若干个组成部分的一种统计方法。统计分组是在统计总体内部进行的一种特定分类,它同时具有两方面的含义:对总体而言是

10、“分”,即将总体分为性质相异的若干部分;对个体而言是“合”,即将在某些方面性质相同的个体组合起来。二、统计分组与分配数列 能否对统计总体进行分组,是由统计总体中各单位所具有的差异性特点决定的。统计总体中的各单位,一方面在某一个或几个标志上具有相同的性质,可以被结合在同一性质的总体中;另一方面,又在其他标志上具有彼此相异的性质,从而又可以被区分为性质不同的若干个组成部分。二、统计分组与分配数列 统计分组的作用统计分组的作用2.统计分组在统计认识过程中的作用主要表现在以下几个方面:(1)统计分组后,能够看出统计资料的基本特点与规律。统计调查取得的资料,往往是大量的、零散的、摸不清头绪的资料,直接观

11、察调查资料,很难了解到社会经济现象的基本情况和特点。二、统计分组与分配数列 (2)可以划分现象的类型。运用统计分组法把现象总体划分为不同类型组之后进行研究,才能知道该现象总体由哪些类型构成和各类型的状态、关系及变化等,才能真正地认识了解这一社会现象,研究才能深入。二、统计分组与分配数列 【例3-6】我国经济分为公有经济和非公有经济两大类型,公有经济包括国有及国有控股经济和集体经济,非公有经济包括个体经济、股份制经济、外商及港澳台商投资经济;工业划分为重工业和轻工业两大类型;社会产品划分为生产资料和消费资料两大类;人口划分为城镇人口和农村人口。(3)有助于深入分析总体内部结构。在社会经济问题的分

12、析和研究中,经常分析研究的结构有经济类型结构、产业结构、产品结构、投资结构、消费结构、技术结构、人才结构,农业生产活动中的种植业、林业、畜牧业和渔业结构,畜牧业生产中的畜群结构,等等。二、统计分组与分配数列 (4)能够表示现象之间的依存关系。一切社会经济现象都不是孤立存在的,而是相互联系、相互依存、相互制约的整体。要揭示和研究现象之间的关系及其影响与作用程度,可以将总体按某一个标志分组,同时观察和分析另外的标志在这种分组下的实际情况,以揭示现象之间的联系、依存和制约的关系。二、统计分组与分配数列 【例3-9】表3-4为2015年某市城镇居民家庭人均收入及恩格尔系数。表表3 3-4 20154

13、2015年某市城镇居民家庭人均收入及恩格尔系数年某市城镇居民家庭人均收入及恩格尔系数二、统计分组与分配数列 选择分组标志选择分组标志3.统计分组中的关键问题是选择分组标志。分组标志就是将统计总体分为若干组成部分的根据。社会经济现象一般都有许多不同的标志。对同一总体进行分组,会有多种选择,为确保分组后的各组能够正确反映事物内部的规律性,选择分组标志时,应遵循以下原则:(1)根据统计研究的目的与任务选择分组标志。在对社会经济现象进行研究时,不同的研究任务要选择不同的分组标志进行分组。二、统计分组与分配数列 (2)选择最能反映现象本质特征的标志作为分组标志。由于社会经济现象复杂多样,所以在选择分组标

14、志时,有多种选择。这就需要根据被研究对象的特征,选择最主要的、最能反映事物本质特征的标志进行分组。二、统计分组与分配数列 【例3-11】研究职工生活水平的高低情况,既可以以职工的工资水平作为分组标志,也可以以职工家庭成员的人均收入水平作为分组标志。相较而言,职工家庭成员的人均收入水平更能反映职工生活水平的高低,更能反映现象的本质特征。因为即使某一职工的工资水平较高,但如果他赡养的人口数很多,其家庭生活水平也不会很高。在进行统计分组时,就要选择其中最能反映问题本质特征的标志(职工家庭成员的人均收入)进行分组,这样能够使我们对所研究的对象有一个正确的认识。二、统计分组与分配数列 (3)根据现象所处

15、的历史时期来选择标志。社会经济现象是随着时间、地点的变化而变化的。同一个标志在过去某个时期是适用的,现在就不一定适用;在这个场合适用,在另一场合就不一定适用。因此,即使是研究同类现象,也要视具体时间、地点、条件的不同而选择不同的分组标志。二、统计分组与分配数列 【例3-12】在研究企业规模的构成状况时,需要对企业按其规模进行分组。一般来说,反映企业规模的标志主要有职工人数、年产值、年产量、固定资产净值和年利润额等。在生产力水平较低的情况下,用职工人数的多少来表示企业规模的大小比较适当;而在技术进步的历史时期或技术装备比较先进的情况下,有的企业由于采用了机械化生产,虽然职工人数不多,但生产能力却

16、很大,因此,职工人数已不能准确地说明企业规模的大小,这时一般使用年产值、固定资产原值或净值等作为反映企业规模的分组标志更为恰当。二、统计分组与分配数列 统计分组的方法统计分组的方法4.统计分组要求将总体内标志表现不同的总体单位分开,将标志表现相同或相近的总体单位归属在同一组。因此,分组标志一经选定,就要突出总体在这一标志下的性质差异或数量差异,即在分组标志范围内,划分各相邻组间的性质界限和数量界限。根据分组标志的不同特征,统计总体可以按品质标志分组,也可以按数量标志分组。二、统计分组与分配数列 (1)按分组标志的性质不同,统计分组可分为品质标志分组和数量标志分组。品质标志分组。按品质标志分组就

17、是选择反映事物属性差异的品质标志为分组标志,并在品质标志的变异范围内划定各组界限,将总体划分成为若干个性质不同的组成部分。数量标志分组。按数量标志进行分组,就是根据统计研究的目的,选择反映事物数量差异的数量标志作为分组标志,在数量标志值的变异范围内划定各组的数量界限,将总体划分为性质不同的若干个部分或组别,结果形成变量数列。二、统计分组与分配数列 (2)按分组标志的多少,统计分组可分为简单分组和复合分组。简单分组。简单分组是指按照一个标志进行分组。例如,表3-6为某班按成绩分组的情况,这种分组形式就属于简单分组。表表3 3-6 6 某班按成绩分组的情况某班按成绩分组的情况二、统计分组与分配数列

18、 表表-7 7 某高校按职称、年龄、性别进行的分组某高校按职称、年龄、性别进行的分组 复合分组。复合分组是指对同一个总体,把两个或两个以上标志层叠起来进行分组。例如,表3-7为某高校按职称、年龄、性别进行的分组,这种分组属于复合分组。二、统计分组与分配数列 二、分配数列 分配数列是统计分组形成的必然产物,是统计整理结果的一种重要表现形式,也是统计描述和统计分析的重要内容。它可以表明总体的分布特征和内部结构,并为研究总体中某种标志的平均水平及其变动规律提供依据。二、统计分组与分配数列 分配数列(distribution series)是在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺

19、序排列而形成的总体中各个单位在各组间的分布,又称分布数列或次数分配。分配数列的概念分配数列的概念1.二、统计分组与分配数列 分配数列的种类分配数列的种类2.根据分组标志的不同,分配数列分为品质分配数列和变量分配数列两种。(1)品质分配数列。按品质标志分组形成的分配数列称为品质分配数列,简称品质数列,也称属性分布数列。(2)变量分配数列。按数量标志分组所编制的分配数列称为变量分配数列,简称变量数列。二、统计分组与分配数列 【例3-16】某饼干加工厂工人生产某产品的日产量资料见表3-10。表表3 3-10 10 某饼干加工厂工人生产某产品的日产量资料某饼干加工厂工人生产某产品的日产量资料 二、统计

20、分组与分配数列 在分组过程中,根据变量值取值范围的不同,分组的形式可以分为单项式分组和组距式分组。变量数列按变量的表示方法和分组方法不同,可以分为单项式分配数列和组距式分配数列两种。单项式分配数列。单项式分配数列是指每一组只包含一个变量值,按单项式分组所编制的变量数列。这种分组形式只适用于离散变量,而且要求离散变量的变动范围较小,变量值个数较少的情况。二、统计分组与分配数列 组距式分配数列。组距式分配数列是以标志值变动的范围作为一组的分组,即组距式分组所形成的变量数列。组距式分配数列适用于所有的连续变量和取值范围较大的离散型变量。例如,表3-13为某班学生的计算机成绩分布,表3-14为某地区销

21、售额与流通费用。二、统计分组与分配数列 表表3 3-13 13 某班学生的计算机成绩分布某班学生的计算机成绩分布二、统计分组与分配数列 表表3 3-14 14 某地区销售额与流通费用某地区销售额与流通费用 二、统计分组与分配数列 变量分配数列的编制变量分配数列的编制3.对于品质数列来讲,如果分组标志选择得合适,分组标准定得恰当,则事物性质的差异表现得就比较明确,总体中的各组也容易划分。在编制品质数列时,只要按规定的分组标准将总体单位按组归类整理即可。品质数列一般比较稳定,通常能准确反映总体的分布特征。这里只对变量分配数列的编制做重点介绍。二、统计分组与分配数列 (1)单项式数列的编制。在编制单

22、项式数列时,一般先将调查所得资料按照数值由小到大的顺序进行排列;然后确定各组的变量值和组数,一般有多少个变量值就有多少组;最后汇总出各变量值出现的次数,编制单项式数列。二、统计分组与分配数列 表表3 3-15 15 某高校在校学生按年龄进行的分组某高校在校学生按年龄进行的分组 单项式数列每组只有一个变量值,各组之间的界限划分也非常明确,因此编制出的数列也很稳定。例如,表3-15为某高校在校学生按年龄进行的分组。二、统计分组与分配数列 (2)组距式数列的编制。组距式数列是将变量值划分为若干区间,因此编制方法有一定的难度。编制步骤如下:将变量值按大小顺序排列,并确定全距。确定组数和组距。我们把分成

23、组的个数称为组数。在组距式数列的每一个组中,每个组的最大值为组的上限(upper limit),最小值为组的下限(lower limit),每个组的上限和下限之间的距离称为组距。二、统计分组与分配数列 由于分组的目的之一是观察数据分布的特征,所以组数的多少应适中。如果组数太少,数据的分布会过于集中;如果组数太多,数据的分布会过于分散。这都不便于观察数据分布的特征和规律。二、统计分组与分配数列 组距是一个组的上限与下限的差,即组距=上限-下限。组距也可根据全部数据的最大值和最小值及所分的组数来确定,即组距=全距/组数。组距宜取5或10的倍数。二、统计分组与分配数列 组数与组距是相互联系的,在同一

24、变量数列中,组距的大小与组数的多少成反比。组数越多,组距越小;组数越少,组距越大。确定组数与组距时,先要找出全距,以及大多数变量集中的区间,然后根据标志变量的分散程度及项目多少等因素来考虑组距和组数的问题。要使组距反映各组之间的数量界限,把性质相同的单位归入一组,将性质不同的单位划分不同的组列,以保证编制的组距数列能尽可能地反映出总体分布的特征及其规律性。二、统计分组与分配数列 如果将例3-17分为两个组距相等的组,可以编制出鸡西市鸡东县居民家庭人均月消费性支出分配数列,见表3-16。表表3 3-16 16 鸡西市鸡东县居民家庭人均月消费性支出分配数列鸡西市鸡东县居民家庭人均月消费性支出分配数

25、列1 1 二、统计分组与分配数列 表表3 3-18 18 鸡西市鸡东县居民家庭人均月消费性支出分配数列鸡西市鸡东县居民家庭人均月消费性支出分配数列3 3 若将其分成6个组距相等的组,则可以编制出表3-18所示的分配数列。二、统计分组与分配数列 上述分析是对同一种资料进行的三种不同的分组,可以看出分组过粗,组距太大;分组过细,组距太小,都不利于显示总体内部各组的分布特征;而表318能较好地反映鸡西市鸡东县居民家庭人均月消费性支出的分布状态。二、统计分组与分配数列 在确定组距时,可以根据标志值变异状况的不同将各组的组距确定为相等的或不等的,相应形成等距数列和异距数列。等距数列是各组组距都相等的数列

26、,一般在社会经济现象性质差异的变动比较均衡或标志变异比较均匀的条件下采用。异距数列是各组组距不等的数列,也称不等距数列,通常适用于社会经济现象数量变动不均衡且很难用等组距的办法来区分事物不同性质的情况。二、统计分组与分配数列 确定组限和组中值。组限(class limit)是指每组两端的数值,即每组两端的标志值。每组的最大值为上限,最小值为下限。在组距式分组中常有最小组无下限和最大组无上限的情况,这样的组称为开口组(open class),其中,有上限无下限的组称为下开口组,有下限无上限的组称为上开口组。例如,表3-14中的第一组50万元以下为下开口组,最后一组300万元及以上为上开口组二、统

27、计分组与分配数列 按连续型变量分组划分组限时,相邻两组的组限必须重叠。这是由于连续变量的相邻两个变量值之间可以做无限的分割,如果上、下限是两个不同的数值的话,那么相邻两组上、下限之间就可能有很多数值无组可归,不符合穷尽性原则。在统计工作中,如果某标志值刚好等于组限,为避免重复计算,一般遵循“上组限不在内”的原则。二、统计分组与分配数列 按离散型变量划分组限时,相邻两组的组限可以以整数断开。因为离散变量不能用小数表示,相邻两个变量值可以以整数断开,所以,如果相邻两组的组限不重叠,就不会导致遗漏。二、统计分组与分配数列 用组中值来代表组内变量值的一般水平存在一个假定,即各单位变量值在本组范围内呈均

28、匀分布,或在组中值两侧呈对称分布。而实际上,各组变量值往往不是均匀分布的,组中值与各组的实际平均水平仍有一定差距,它只是各组实际平均值的近似值。二、统计分组与分配数列 频数和频率。频数也称次数,是对总体按一定标志进行分组,统计出各个组内所含单位的个数。频率是每组的频数与总数的比值。各组频数(如表3-18中的“绝对数”列)之和等于总次数,各组频率(如表3-18中的“相对数”列)之和等于1或100。在变量分配数列中,频数(频率)表明该组标志值的作用程度。频数(频率)数值越大,表明该组标志值对于总体水平所起的作用越大;反之,频数(频率)数值越小,表明该组标志值对于总体水平所起的作用越小。二、统计分组

29、与分配数列 累计频数。为研究整个变量数列的次数分配状况,统计工作中还常计算累计次数。将变量数列中各组的次数和频率逐组累计相加而成累计次数分布,它表明总体在某一变量值的某一水平上下包含的总体频数和频率。二、统计分组与分配数列 累计次数和累计频率的计算方法有两种:向上累计和向下累计。向上累计又称较小制累计,是将各组的次数或频率由变量值低的组向变量值高的组累计,各累计数的意义是小于该组上限的累计次数或累计频率。向下累计又称较大制累计,是将各组的次数或频率由变量值高的组向变量值低的组累计,各累计数的意义是大于该组下限的累计次数或累计频率。二、统计分组与分配数列 由表3-19可知,鸡西市鸡东县调查的40

30、户居民家庭中人均月消费支出低于400元的有9户,占全部调查户数的22.5。人均月消费支出高于500元的有6户,占全部调查户数的15。表表3 3-19 19 鸡西市鸡东县居民家庭人均月消费性支出鸡西市鸡东县居民家庭人均月消费性支出 统计数据的显示0303三、统计数据的显示 统计表就是用纵横交叉的直线所组成的表格来显示统计数据的表格。统计表的运用范围极其广泛,是表现统计资料最常用的形式。其主要优点是:能使统计资料条理化,更清晰地表述统计数据之间的相互联系;统计数据的显示简明易懂;便于计算和比较表内的各项统计指标,并易于检查数字的完整性和正确性。一、统计表统计表的概念和构成统计表的概念和构成1.三、

31、统计数据的显示 “总标题”是统计表的名称,用以概括说明整个表的内容,多数情况下要包括总体的时间和空间限制,一般位于表的上方中央。“横行标题”是横行内容的名称,通常用来说明总体及其各组的名称,通常也称其为主词,一般列在表的左边。“纵栏标题”是纵栏内容的名称,通常用来表示反映总体及其各组成部分数量特征统计指标的名称,通常也称其为宾词,一般列在表内的上方。“数字资料”是各项指标的具体数值,内容由横行标题和纵栏标题所限定,其数字可以是绝对数、相对数或平均数。三、统计数据的显示 统计表从其内容上看,由两部分组成:一部分是主词,另一部分是宾词,如图32所示。主词是统计表的主体,也是统计表所要说明的对象。主

32、词通常用横行标题来表示。宾词是说明主词的各项指标,一般由纵栏标题和指标数值组成。统计表的主词和宾词的位置一般如上所述,但并非固定不变的,有时为了编排合理与阅读方便,可以将主词和宾词的位置互换。三、统计数据的显示 统计表的分类统计表的分类2.统计表按对总体分组的情况不同可以分为简单表、分组表和复合表。(1)简单表。简单表是指对统计总体未做任何分组,仅按单位名称或时间顺序排列而成的统计表,见表3-20和表3-21。三、统计数据的显示 表表3 3-20 20 中国主要河流的基本情况中国主要河流的基本情况三、统计数据的显示 表表3 3-21 201021 2010年年20152015年某省国民收入及国

33、内生产总值单位:亿元年某省国民收入及国内生产总值单位:亿元三、统计数据的显示 (2)分组表。分组表又称简单分组表,是指对统计总体仅按一个标志进行分组而形成的统计表,见表3-22和表3-23。利用分组表可以深入分析现象的内部结构和现象间的相互依存关系。三、统计数据的显示 表表3 3-2-22 2 某企业职工文化构成情况某企业职工文化构成情况三、统计数据的显示 表表3 3-23 5623 56个农户按养猪头数分组个农户按养猪头数分组三、统计数据的显示 (3)复合表。复合表又称复合分组表,是指对统计总体按两个或两个以上标志进行层叠分组而形成的统计表,见表3-24和表3-25。三、统计数据的显示 表表

34、3 3-24 201524 2015年高等学校普通本、专科部分学科招生人数年高等学校普通本、专科部分学科招生人数 单位:人单位:人三、统计数据的显示 表表3 3-25 25 某地区某地区20152015年国民生产总值和职工人数统计年国民生产总值和职工人数统计三、统计数据的显示 为了使统计表能够科学地反映被研究对象的数量特征,同时为了美观和标准化,编制统计表时除了应遵循科学、实用、简练、美观的原则外,还要符合以下要求:(1)统计表的标题、项目、指标要简明扼要,应写明资料所属的时间和空间范围,使人一目了然,便于分析。(2)统计表的纵栏、横行的排列要尽量反映出内容方面的逻辑关系。(3)当统计表的栏目

35、较多时,可进行编号以说明其相互关系。主词栏和计量单位栏常用甲、乙、丙等文字编号,宾词栏常用1、2、3等数字编号。编制统计表的要求编制统计表的要求3.三、统计数据的显示 (4)表中的合计栏可以排在前面,也可以排在最后,如果只列出其中部分项目,则合计栏必须排在前面。(5)表中的统计数字应书写工整、字迹清晰;数字应填写整齐、数位对准。(6)国际上规范的统计表是“三线表”,表的上下两端用粗线,左右两边不封口,纵栏之间用细线分开,横行之间可以不加线。如果横行过多,也可以每五行加一条细线。(7)统计表的资料来源及其他需要说明的问题可在表下加以注明,如统计资料的来源、填表时间、制表人、审核人等。(8)统计表

36、中的数字资料都要注明计量单位。计量单位应按统计制度的规定填写,不得另设不同的计量单位。三、统计数据的显示 二、统计图 统计图是人们用来展示统计资料的另一种常用形式,它是根据整理过的统计资料,运用几何图形或具体的形象来表现被研究对象的数量关系和数量特征的图形。与统计表相比,它更为鲜明、醒目、生动和直观。三、统计数据的显示 直方图是用矩形的宽度和高度来表示频数分布的图形。在平面直角坐标系中,横轴表示数据分组,纵轴表示频数或频率,这样各组与相应的频数就形成了一个矩形,即直方图。它一般用来表现连续型变量的分布特征。根据表3-26可绘制成直方图,结果如图3-所示。直方图直方图1.三、统计数据的显示 表表

37、3 3-26 26 某村人口按年龄分组某村人口按年龄分组三、统计数据的显示 图图3 3-3 3 某村人口年龄分布直方图某村人口年龄分布直方图三、统计数据的显示 条形图条形图2.条形图是用宽度相同的条形的高度或长度来表示数据变动的图形。条形图可以横置和纵置,纵置时也称柱形图。它一般用来表示品质数列或者离散型变量的分布情况。三、统计数据的显示 条形图和直方图不同,条形图用条形的长度(横置时)表示各类别数量的多少,其宽度(表示类别)是固定的,直方图是用面积表示数量的多少;直方图各矩形通常是连续排列的,而条形图则是分开排列的。三、统计数据的显示 折线图折线图3.折线图也称频数多边图,它是在直方图的基础

38、上把相邻直方形的顶边中点连接成一条折线,就形成了频数分布折线图。折线图也可以用组中值与次数求坐标点连接而成。三、统计数据的显示 曲线图曲线图4.在分组很多的情况下,组距会越来越小,这时所绘制的折线图就会越来越光滑,渐渐形成一条平滑的曲线,这就是分布曲线。曲线图是用曲线的升降起伏来表示被研究现象的变动情况及其趋势的图形。三、统计数据的显示 圆形图圆形图5.圆形图又称饼图,它是以圆的面积或圆内各扇形的面积来表示数值大小或总体内部结构的一种图形。根据表3-27绘制的圆形图如图3-7所示。三、统计数据的显示 图图3 3-7 7 某大学职工的岗位分布圆形图某大学职工的岗位分布圆形图三、统计数据的显示 环

39、形图环形图6.环形图中间有一个“空洞”,总体中的每部分数据用环中的一段表示。环形图可以同时绘制多个总体的数据系列,每一个数据系列为一个环,可以显示多个总体各部分所占的相应比例,从而有利于进行比较研究。三、统计数据的显示 雷达图雷达图7.雷达图既像雷达荧光屏上看到的图像,又像蜘蛛网,因此也有人称之为蛛网图。雷达图在显示或对比各变量的数值时非常有用。利用雷达图也可以研究多个样本之间的相似程度。例如,2015年某省三市居民生活消费支出构成见表3-29。三、统计数据的显示 图图3 3-9 20159 2015年某省三市居民消费支出构成的雷达图年某省三市居民消费支出构成的雷达图0404四、SPSS软件在

40、数据统计中的应用 第一步:在数据编辑窗口中输入数据,由于薯片的质量是一个连续量,并且根据排序后的数据文件可知该组数据中最大的为61,最小的为40;并将这组数据等分为区间长度为3的8个分组。利用重新编码对统计数据进行统计分组,为了得到人为的分组,首先对“薯片重量”进行重新编码,得到新变量“薯片重量分组”。一、应用案例一利用数据重编码利用数据重编码1.四、SPSS软件在数据统计中的应用 第二步:执行“转换”“重新编码为不同变量”命令(见图3-10),打开“重新编码为其他变量”对话框(见图3-11)可以得到一个与重编码前不同的变量。第三步:在“重新编码为其他变量”对话框中,从变量列表中选择“薯片重量

41、”选项,将其移入“输入变量-输出变量”列表框内,然后将光标移到“输出变量”选项组的“名称”文本框内,输入新变量名“薯片重量分组”,在“标签”文本框中对其进行详细说明(也可不做说明),完成后单击“更改”按钮。四、SPSS软件在数据统计中的应用 图图3 3-10 10 执行执行“重新编码为不同变量重新编码为不同变量”命令命令四、SPSS软件在数据统计中的应用 图图3 3-11 “11 “重新编码为其他变量重新编码为其他变量”对话框对话框四、SPSS软件在数据统计中的应用 第四步:单击“旧值和新值”按钮,打开“重新编码到其他变量:旧值和新值”对话框,在该对话框中可以定义新旧变量值的转换内容,进行分组

42、区间的定义。在“重新编码到其他变量:旧值和新值”对话框中,左侧是“旧值”选项组,右侧是“新值”选项组,在“旧值”选项组中选中“范围”单选按钮,可以指定分组区间的上限和下限,并在“新值”选项组的“值”文本框中给出该区间相对应的组号。单击“添加”按钮即可将确认的分组区间添加到“旧-新”列表框中。四、SPSS软件在数据统计中的应用 图图3 3-13 13 完成重新编码完成重新编码 第五步:在“重新编码为其他变量”对话框中,单击“确定”按钮,完成重新编码,结果如图3-13所示。对重新编码的数据进行频数分析对重新编码的数据进行频数分析2.图图3 3-14 “14 “频率(频率(F F)”对话框对话框 第

43、一步:执行“分析”“描述统计”“频率”命令,打开“频率(F)”对话框,如图3-14所示。四、SPSS软件在数据统计中的应用 图图3 3-13 13 完成重新编码完成重新编码 第五步:在“重新编码为其他变量”对话框中,单击“确定”按钮,完成重新编码,结果如图3-13所示。四、SPSS软件在数据统计中的应用 图图3 3-15 “15 “频率:图表频率:图表”对话框对话框 第二步:在“频率(F)”对话框中,将新变量“薯片重量分组”移入“变量”列表框内,单击“图表”按钮,打开“频率:图表”对话框,如图3-15所示。四、SPSS软件在数据统计中的应用 第三步:在“频率:图表”对话框的“图表类型”选项组中

44、有4个单选按钮,其中,“无”表示作图,“条形图”“饼图”和“直方图”系统默认为“无”。本例选中“直方图”单选按钮,然后单击“继续”按钮,回到“频率(F)”对话框。四、SPSS软件在数据统计中的应用 图图3 3-13 13 完成重新编码完成重新编码 第四步:在“频率(F)”对话框中单击“确定”按钮,得到输出结果,如图3-16和图3-17所示。四、SPSS软件在数据统计中的应用 图图3 3-17 17 重新分组的频数分布重新分组的频数分布四、SPSS软件在数据统计中的应用 图图3 3-18 “18 “频率:统计量频率:统计量”对话框对话框 此外,还可以运用SPSS软件对该组数据的分布特征进行描述,

45、步骤如下:(1)打开数据,执行“分析”“描述统计”“频率”命令,打开“频率(F)”对话框。(2)在“频率(F)”对话框中,将“薯片重量”变量移入“变量”列表框中,单击“统计量”按钮,打开“频率:统计量”对话框,如图3-18所示。四、SPSS软件在数据统计中的应用 在此对话框的“百分位值”选项组中有三个复选框,其中,“四分位数”复选框可以列出标志值的四分位点;“割点”复选框可以列出标志值的n分位点,具体数值根据需要填入后面的文本框中;“百分位数”复选框可以自由规定输出标志值的百分位点。“集中趋势”选项组中有四个复选框,即均值、中位数、众数和合计。“离散”选项组中有六个选项,即标准差、最小值、方差

46、、最大值、范围和均值的标准误。“分布”选项组中有“偏度”和“峰度”两个复选框。在图3-18所示的对话框中,选中四分位数、均值、中位数、众数、均值的标准误、范围、最大值、最小值、峰度和偏度等复选框,单击“继续”按钮,在“频率(F)”对话框中单击“确定”按钮,即可以得到图3-19所示的结果。图图3 3-19 19 薯片重量分组统计量薯片重量分组统计量四、SPSS软件在数据统计中的应用 执行“分析”“描述统计”“频率”命令,打开“频率(F)”对话框,选择变量“产业类别”并将其移到“变量”列表框中,选中“显示频率表格”复选框。在“频率(F)”对话框中单击“图表”按钮,打开“频率:图表”对话框,在此对话

47、框中选中“图表类型”选项组中的“条形图”单选按钮,选中“图表值”选项组中的“频率”单选按钮。二、应用案例二四、SPSS软件在数据统计中的应用图图3 3-22 “22 “可视化封装可视化封装”对话框对话框 第一步:执行“转换”“可视离散化”命令,打开“可视化封装”对话框,如图3-22所示。四、SPSS软件在数据统计中的应用 图图3 3-23 23 详细设置界面详细设置界面 第二步:将“注册资本”变量移入“要离散的变量”文本框,单击“继续”按钮,进入详细设置界面,在该界面中给分组后的变量命名,在“离散的变量”两个文本框中分别输入“注册资本分组”和“注册资本(离散化)”作为离散化变量的名称和标签,如

48、图3-23所示。四、SPSS软件在数据统计中的应用 图图3 3-24 24 设置分割点后的结果设置分割点后的结果 第三步:设置分割点。单击“生成分割点”按钮,打开“生成分割点”对话框,在“间隔至少填充两个字段”选项组的“第一个分割点的位置”文本框中输入700,在“分隔点数量”文本框中输入3,在“宽度”文本框中输入100.000,单击“应”按钮,结果如图3-24所示。四、SPSS软件在数据统计中的应用 图图3 3-25 25 生成生成“注册资本分组注册资本分组”第四步:生成分组标签。单击“可视化封装”对话框中的“生成标签”按钮,选中“排除(E)()”单选按钮,系统将自动生成分组标签,单击“确定”

49、按钮,弹出“封装规范将创建1个变量”提示框,单击“确定”按钮,即可在数据文件中生成新变量“注册资本分组”,结果如图3-25所示。四、SPSS软件在数据统计中的应用 第五步:编制注册资本分组的等距式分组频率分布表。回到数据编辑界面,执行“分析”“描述统计”“频率”命令,打开“频率(F)”对话框,将“注册资本(离散化)注册资本分组”移入“变量”列表框中,单击“图表”按钮,在打开的“频率:图表”对话框中选中“频率”单选按钮,单击“继续”按钮,再单击“确定”按钮,系统输出结果,如图3-26和图3-27所示。图图3 3-26 26 企业按注册资本分组的频数分布统计企业按注册资本分组的频数分布统计四、SPSS软件在数据统计中的应用 图图3 3-27 27 企业按注册资本分组条形图企业按注册资本分组条形图 感 谢 收 看!

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(统计学第三章课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|