1、统 计 学StatisticsStatistics第二章 统计数据的收集与整理第一节 统计数据收集一、收集资料的方式概括起来分为直接方式和间接方式(一)统计资料的直接收集 主要包括统计调查和试验设计主要包括统计调查和试验设计(二)统计资料的间接收集 通过各种渠道收集第二手资料通过各种渠道收集第二手资料(一)统计资料的直接收集1.统计调查调查时点现象一次性调查:主要适合调查时期现象经常性调查:主要适合按调查时间是否连续、典型调查、抽样调查非全面调查:重点调查普查全面调查:统计报表、按调查单位的范围调查调查、典型调查、抽样专门调查:普查、重点统计报表按调查组织形式统计调查(1)普查普查(Censu
2、s)是专门组织的一次性的全面调查。特 点:其他调查方式不能替代;涉及面广、准确度要求高、时效性强,必须统一领导、统一要求、统一行动。组织原则:规定标准时点;确定普查期限;规定调查项目;选择普查的时期;用 途:对没有必要经常调查的项目;其他调查方法达不到既定精度的情况。今后,我国的普查将规范化、制度化,即每逢末尾数字为“0”的年份进行人口普查,每逢“3”的年份进行第三产业普查,每逢“5”的年份进行工业普查,每逢“7”的年份进行农业普查,每逢“1”或“6”的年份进行统计基本单位普查7 第六次全国人口普查第六次全国人口普查 主要目的:人口普查是一项重大的国情国力调查。组织开展第六次全国人口普查,将查
3、清十年来我国人口在数量、结构、分布和居住环境等方面的变化情况,为科学制定国民经济和社会发展规划,统筹安排人民的物质和文化生活,实现可持续发展战略,构建社会主义和谐社会,提供科学准确的统计信息支持。内容:人口和住户的基本情况,内容包括:性别、年龄、民族、受教育程度、行业、职业、迁移流动、社会保障、婚姻生育、死亡、住房情况等。时间:标准时点是2010年11月1日零时。主要目的是全面调查了解第二产业和第三产业的发主要目的是全面调查了解第二产业和第三产业的发展规模及布局,了解产业组织、产业结构、产业技术的展规模及布局,了解产业组织、产业结构、产业技术的现状以及各生产要素的构成,进一步查实服务业、战略现
4、状以及各生产要素的构成,进一步查实服务业、战略性新兴产业和小微企业的发展状况,摸清各类单位的基性新兴产业和小微企业的发展状况,摸清各类单位的基本情况,全面更新覆盖国民经济各行业的基本单位名录本情况,全面更新覆盖国民经济各行业的基本单位名录库、基础信息数据库和统计电子地理信息系统。库、基础信息数据库和统计电子地理信息系统。第三次全国经济普查的标准时点是2013年12月31日,2014年12月16日公布普查结果。(2)抽样调查抽样调查(Sampling Survey):按照随机原则从总体中抽取一部分调查单位进行观察,用以推断总体。特 点:按照随机的原则抽取调查单位;由抽查结果从数量上推断总体;对总
5、体推断的准确性和可靠性有概率保证。用途:用途:不可能进行全面调查的情况下;不可能进行全面调查的情况下;可以进行全面调查但经济上不合算的情况下;可以进行全面调查但经济上不合算的情况下;时间紧迫的情况下;时间紧迫的情况下;检查修正普查和全面调查的结果;检查修正普查和全面调查的结果;对生产过程进行质量控制。对生产过程进行质量控制。(3)重点调查重点调查(Key-point Survey):从调查对象中选取一部分对全局具有决定作用的重点单位进行调查。特 点:调查单位少、经济,对重点单位之外的其他单位可进行抽样调查作为对总体调查的补充。所谓重点调查单位,是指这些被调查的总体单位中数目不多,所占比重不大,
6、但其调查的标志值却在总量中占有很大比重,在总体中具有举足轻重的作用。(20/80法则,即帕累托法则)(4)统计报表(制度)Statistical Report Forms 按照国家统一规定的表格形式,定期地、自 上而下布置,自下而上填报统计资料的一种调查形式。特 点:已经形成一种制度;可以组织全面、非全面调查。类 型:国家统计报表、业务统计报表、地方统计报表;半月报、月报、季报、半年报、年报。用 途:用于搜集全面的基本情况,也为重点调查等非全面调查所采用。(5)典型调查(课外)典型调查(Model Survey):选取少数具有代表性的单位进行深入细致的调查,以把握总体的特征。特 点:属于社会调
7、查方法;可以取得第一手数据资料和文字资料、资料具体生动,便于总结经验教训。关 键:选好典型典型调查的质量保证。典型调查方式有两种:一是“解剖麻雀”式调查,它在调查对象总体单位之间的差异较小时适用。二是“划类选典”式的调查,它在调查对象总体各单位之间的差异较大时适用。注意事项:1)正确地选择典型单位;2)注意点与面的结合;3)必须将定性分析与定量分析结合起来。2.2.试验设计 科学试验是进行科学研究的重要手段,在科学试验是进行科学研究的重要手段,在许多学科中几乎都起着积极的作用。统计中的许多学科中几乎都起着积极的作用。统计中的试验设计是科学试验研究的组成部分之一试验设计是科学试验研究的组成部分之
8、一。试验设计,包括五个相互关联的环节,分别是:试验设计,包括五个相互关联的环节,分别是:方案设计方案设计方案实施方案实施数据采集数据采集数据分析数据分析优化生产优化生产(二)统计资料的间接收集凡不是通过直接的统计调查和试验,而是从其他各种渠道搜集的第二手资料,我们把它总称为统计资料的间接收集。间接资料的来源大体包括:统计年鉴、统计摘要、统计资料汇编、统计台账、统计公告、报纸、杂志、网上资料等。数据的搜集方法询问调查询问调查观察实验观察实验数据的搜集方法数据的搜集方法二、收集资料的方法 数据资料的收集方法可以分为初级资料收集方法和次级资料收集方法或称文案资料。(一)初级资料收集方法(一)初级资料
9、收集方法 1.1.访问法访问法 访问法是按所拟调查事项,有计划地通过访访问法是按所拟调查事项,有计划地通过访谈询问方式向被调查者提出问题,通过他们的回谈询问方式向被调查者提出问题,通过他们的回答来获得有关信息资料的方法。答来获得有关信息资料的方法。按访问内容的传递方式不同,可分为按访问内容的传递方式不同,可分为:面谈调查、电话调查、邮寄调查、留置调查、日面谈调查、电话调查、邮寄调查、留置调查、日记调查和网上调查等方法。记调查和网上调查等方法。2.观测法 观测法是指调查者通过直接观测、跟踪和记录被调查者的情况来收集资料的一种调查方法。3.报告法 报告法是由报告单位根据原始记录和核算资料,按照统计
10、机关颁发的统一的表格和要求,按一定的报送程序提供资料的方法。(二)次级资料收集方法(二)次级资料收集方法次级资料又称二手资料,是指他人为了自己的研究目的而调查、整理的资科。1.1.根据研究项目的内容判别所需资料的类型根据研究项目的内容判别所需资料的类型 2.2.寻找资料的来源寻找资料的来源 3.3.对次级资料的查找对次级资料的查找 4.4.对查找的资料进行甄别、清理、补充对查找的资料进行甄别、清理、补充 准确性和可靠性是统计工作的生命!三、统计数据的质量问题(一)真值与相对真值客观现象的实际数量水平可理解为两层意思:一是真值,即客观现象真正存在的数量状态,是唯一的,但往往不易取得;二是相对真值
11、,它是根据事先确定下来的统计方案,正确实施该方案的各项规定而应该取得的值。真值与相对真值之间存在的差异应该以不影响统计认识为前提,否则说明统计方案存在问题。真值与相对真值可以作为观测数据质量评估的参照数。(二)统计调查误差调查误差是指经过调查所获得的统计数值与被调查对象实际数值之间的差别。调查误差有两种:一种是登记性误差 一种是代表性误差登记误差是由于调查过程中各有关环节工作的失误而造成的。例如,调查方案中有关规定或解释不清楚而产生歧义,或计算错误、抄录错误,或汇总错误以及不真实填报等。代表性误差是由于非全面调查只观察总体一部分单位,这部分单位不能完全反映总体的性质而产生的误差。登记性误差产生
12、的三个原因:登记性误差产生的三个原因:1)由于数据调查准备工作不充分而引起的误差;2)数据收集阶段产生的误差;3)资料整理过程中产生的误差。统计的整个工作过程就是对数据的加工统计的整个工作过程就是对数据的加工过程,从原始数据的收集开始,经过整理、过程,从原始数据的收集开始,经过整理、显示、样本信息的获取到总体数量规律性的显示、样本信息的获取到总体数量规律性的科学推断,都有一个减少误差、提高数据质科学推断,都有一个减少误差、提高数据质量的问题。也就是说,量的问题。也就是说,统计数据的质量控制统计数据的质量控制问题是贯穿于统计全过程的重要问题,问题是贯穿于统计全过程的重要问题,因此,因此,加强统计数据质量的管理要体现在统计研究加强统计数据质量的管理要体现在统计研究的全过程。的全过程。谢 谢!