1、统统 计计 学学11/11/20221第二章第二章 统计数据的统计数据的搜集与整理搜集与整理n本章要求:了解数据的计量尺度,本章要求:了解数据的计量尺度,明确数据的表现形式(绝对数、明确数据的表现形式(绝对数、相对数);会使用统计数据的搜相对数);会使用统计数据的搜集方法;掌握统计数据整理中的集方法;掌握统计数据整理中的统计分组和变量数列的编制。统计分组和变量数列的编制。11/11/20222本章主要内容本章主要内容n本章共分四节:本章共分四节:n第一节第一节 数据的计量与类型数据的计量与类型n第二节第二节 统计数据的来源统计数据的来源n第三节第三节 统计数据的质量统计数据的质量 n第四节第四
2、节 统计数据的整理统计数据的整理11/11/20223第一节第一节 数据的计量与类型数据的计量与类型n本节需要把握三个问题:本节需要把握三个问题:n一、数据的计量尺度;一、数据的计量尺度;n二、数据的类型;二、数据的类型;n三、统计数据的表现形式。三、统计数据的表现形式。11/11/20224一、数据的计量尺度一、数据的计量尺度n统计数据是对客观现象进行计量的结果,统计数据是对客观现象进行计量的结果,进行计量就必须弄清楚数的计量尺度。进行计量就必须弄清楚数的计量尺度。n根据对事物计量的精确程度,将计量尺根据对事物计量的精确程度,将计量尺度由低到高、由粗略到精确分为四个层度由低到高、由粗略到精确
3、分为四个层次:次:11/11/20225四种计量尺度四种计量尺度11/11/202261 1、列名尺度、列名尺度n(1)含义:又)含义:又称定类尺度,是最粗略、称定类尺度,是最粗略、计量层次最低的计量尺度,是按照客观计量层次最低的计量尺度,是按照客观现象的某种属性对其进行平行的分类或现象的某种属性对其进行平行的分类或分组。这种测度各类间是平等并列关系,分组。这种测度各类间是平等并列关系,无优劣大小之分。无优劣大小之分。n例如,按性质对企业分组为国有、集体、例如,按性质对企业分组为国有、集体、私营、混合制等。私营、混合制等。11/11/202271 1、列名尺度、列名尺度n(2)分类结果的表示:
4、用数字或)分类结果的表示:用数字或编码表示。编码表示。n例如,人口按性别分为男女,用例如,人口按性别分为男女,用“1”表示男性,用表示男性,用“0”表示女性。表示女性。在统计处理中可以计算各类元素的在统计处理中可以计算各类元素的单位数。单位数。11/11/202281 1、列名尺度、列名尺度n(3 3)分类的要求:分类必须符合)分类的要求:分类必须符合穷尽穷尽(指在所指在所做的全部分类中,必须保证每一个元素或个体做的全部分类中,必须保证每一个元素或个体都能归属某一个类别,不能有所遗漏都能归属某一个类别,不能有所遗漏)和和互斥互斥(指每一个元素或个体只能归属一个类别,而(指每一个元素或个体只能归
5、属一个类别,而不能在其他类别中重复出现)的要求,每一元不能在其他类别中重复出现)的要求,每一元素归于一类并且只属于一类。素归于一类并且只属于一类。n定类尺度是对事物最基本的测度,它是其它计定类尺度是对事物最基本的测度,它是其它计量尺度的基础。量尺度的基础。11/11/202292 2、顺序尺度、顺序尺度n又称定序尺度,它是对事物间的等级差或顺又称定序尺度,它是对事物间的等级差或顺序差的一种测度,比定类尺度更高一级的计序差的一种测度,比定类尺度更高一级的计量尺度。它既可测度类别差又可测度次序差,量尺度。它既可测度类别差又可测度次序差,结果可比较顺序。结果可比较顺序。n例如,学生成绩可以分为优、良
6、、中、及格例如,学生成绩可以分为优、良、中、及格和不及格等五类。产品等级分为一、二、三和不及格等五类。产品等级分为一、二、三级等。级等。n计量结果只能比大小,不能计算加减乘除。计量结果只能比大小,不能计算加减乘除。11/11/2022103 3、间隔尺度、间隔尺度n又称定距尺度,它能区分事物类型并排又称定距尺度,它能区分事物类型并排序,且能准确指出类别间差距多少。它序,且能准确指出类别间差距多少。它是对事物类别或次序间间距的测度,常是对事物类别或次序间间距的测度,常用自然或物理单位作为计量尺度,例如,用自然或物理单位作为计量尺度,例如,重量用重量用“克克”“”“千克千克”度量等。度量等。n计量
7、结果为数值,并可计算差值,可进计量结果为数值,并可计算差值,可进行加减运算。行加减运算。11/11/2022114 4、比率尺度、比率尺度n(1)含义:又称定比尺度,它是在间隔尺度)含义:又称定比尺度,它是在间隔尺度的基础上,确定相应的比较基数,将两种相关的基础上,确定相应的比较基数,将两种相关的数加以对比而形成相对数的数加以对比而形成相对数(或平均数或平均数),反映,反映现象的结构、比重、速度、密度等数量关系。现象的结构、比重、速度、密度等数量关系。n例如,将一国的国内生产总值与该国的人口数例如,将一国的国内生产总值与该国的人口数对比,计算人均国内生产总值,以此反映该国对比,计算人均国内生产
8、总值,以此反映该国的经济能力。的经济能力。11/11/2022124 4、比率尺度、比率尺度n(2 2)与间隔尺度的区别:计量结果为比值,要求有)与间隔尺度的区别:计量结果为比值,要求有绝对固定的绝对固定的“零点零点”,“0”0”表示表示“没有没有”或或“不存不存在在”,如收入为,如收入为0 0,表无收入;间隔尺度无绝对,表无收入;间隔尺度无绝对“零零点点”,“0”0”是一个有意义数值,即是一个有意义数值,即“0”0”水平,不水平,不表表“没有没有”或或“不存在不存在”,如考试为,如考试为“0”0”,表成绩,表成绩水平为水平为“0”0”,而不表示没有成绩。温度为,而不表示没有成绩。温度为“0”
9、0”n(3 3)其结果可进行加减乘除运算。)其结果可进行加减乘除运算。n上述四种计量尺度间可以从高层尺度转化为低层尺上述四种计量尺度间可以从高层尺度转化为低层尺度,但不能反之。度,但不能反之。11/11/202213四种计量尺度的比较四种计量尺度的比较四种计量尺度的比较四种计量尺度的比较列名列名尺度尺度顺序顺序尺度尺度间隔间隔尺度尺度比率比率尺度尺度 分类分类(=,)排序排序()间距间距(+,-)比比值值(,)“”11/11/202214二、数据的类型二、数据的类型n把握两个问题:把握两个问题:n1 1、定性数据、定性数据n2 2、定量数据;、定量数据;11/11/2022151 1、定性数据
10、、定性数据n定性数据又称品质数据,说明事物定性数据又称品质数据,说明事物品质特征,不能用数值表示,其结品质特征,不能用数值表示,其结果为类别,是由定类、定序尺度计果为类别,是由定类、定序尺度计量,可计算各组的频数或频率。量,可计算各组的频数或频率。11/11/2022162 2、定量数据、定量数据n定量数据又称数量数据,它说明现象定量数据又称数量数据,它说明现象的数量特征,能用数值表示,由定距、的数量特征,能用数值表示,由定距、定比尺度计量形成,可用各种统计方定比尺度计量形成,可用各种统计方法处理。法处理。11/11/202217三、统计数据的表现形式三、统计数据的表现形式n把握两个问题:把握
11、两个问题:n数量统计数据的两种基本形式数量统计数据的两种基本形式:n1 1、绝对数;、绝对数;n2 2、相对数。、相对数。11/11/202218n(1 1)概念:是统计数据的基本表)概念:是统计数据的基本表现形式,现形式,现象的规模、水平一般以现象的规模、水平一般以绝对数形式表现,例如,国内生产绝对数形式表现,例如,国内生产总值、产品总产量、人口数、进出总值、产品总产量、人口数、进出口额等。口额等。1 1、绝对数、绝对数11/11/202219n(2 2)计量单位:有)计量单位:有实物单位、价值单位和复合实物单位、价值单位和复合单位。单位。n实物单位是据事物的自然属性和特点,采用自然实物单位
12、是据事物的自然属性和特点,采用自然和度量衡单位计量,如人口数用人计量,对于一和度量衡单位计量,如人口数用人计量,对于一些化工产品,常常折合成为标准实物单位。些化工产品,常常折合成为标准实物单位。n价值单位是以货币形式进行计量,如国内生产总价值单位是以货币形式进行计量,如国内生产总值等。值等。n复合单位是由两种或两种以上计量单位复合而成复合单位是由两种或两种以上计量单位复合而成的,如的,如“吨公里吨公里”、“千瓦时千瓦时”。1 1、绝对数、绝对数11/11/2022201 1、绝对数、绝对数n(3 3)分类)分类n按时间状态分为时期数和时点数按时间状态分为时期数和时点数nA A、时期数:反映现象
13、在一段时期内的总量,时期数:反映现象在一段时期内的总量,具有连续统计和可加性的特点,其数值大小具有连续统计和可加性的特点,其数值大小与所属的时间长短有直接关系,如国内生产与所属的时间长短有直接关系,如国内生产总值、进出口总额。总值、进出口总额。11/11/2022211 1、绝对数、绝对数n(3 3)分类)分类nB、时点数:反映现象在某一瞬间时刻的总、时点数:反映现象在某一瞬间时刻的总量,只能间断计数,不具有可加性,其数值量,只能间断计数,不具有可加性,其数值大小与时点间隔长短没直接关系。大小与时点间隔长短没直接关系。n如期末人口数、期末在建工程投资额等。如期末人口数、期末在建工程投资额等。1
14、1/11/202222思考题思考题n出生人口数是时期数还是时点数?出生人口数是时期数还是时点数?11/11/2022232 2、相对数、相对数n(1)相对数是两个绝对数的比值,反映)相对数是两个绝对数的比值,反映事物的相对数量,可以表现为百分数、千事物的相对数量,可以表现为百分数、千分数、倍数、系数、成数等。分数、倍数、系数、成数等。n(2)相对数的基本形式:比例、比率。)相对数的基本形式:比例、比率。A、比例:是一个总体中各个部分的数量、比例:是一个总体中各个部分的数量占总体数量的比重,反映总体的结构,又占总体数量的比重,反映总体的结构,又称称结构相对数结构相对数。如产品合格率。如产品合格率
15、。11/11/2022242 2、相对数、相对数n假定总体数量假定总体数量N被被分成分成K个部分,每一个部分,每一部分的数量分别为部分的数量分别为N1,N2,NK,则则比例定义为比例定义为Ni/N,各部分比例和为各部分比例和为1,即:即:n N 1/N+N2/N+n +Nk/N=1 11/11/2022252 2、相对数、相对数nB B、比率:是各不同类别的数量的比值。比率:是各不同类别的数量的比值。n它可以是总体中各部分的数量对比,又称它可以是总体中各部分的数量对比,又称比例相对数比例相对数,如积累、消费之比;还可以,如积累、消费之比;还可以是同一现象在不同时间或空间上数量之比,是同一现象在
16、不同时间或空间上数量之比,又称又称动态、比较相对数动态、比较相对数,如经济增长速度,如经济增长速度等;等;11/11/2022262 2、相对数、相对数n比例相对数比例相对数=总体中某一部分数值总体中某一部分数值/同一总同一总体中另一部分数值体中另一部分数值n动态相对数动态相对数=报告期水平报告期水平/基期水平基期水平=发展发展速度速度n比较相对数比较相对数=甲地区(单位)某指标数值甲地区(单位)某指标数值/乙地区(单位)某指标数值乙地区(单位)某指标数值11/11/2022272 2、相对数、相对数n B B、比率:还可以是不同现象数量的比较,反映比率:还可以是不同现象数量的比较,反映密度、
17、强度,又称密度、强度,又称强度相对数强度相对数,如人口密度、,如人口密度、人均人均GDPGDP等。等。n强度相对数强度相对数=某一指标数值某一指标数值/另一有联系的指标另一有联系的指标数值数值11/11/2022282 2、相对数、相对数n强度相对数有单位,如人强度相对数有单位,如人/平方公里;平方公里;n还有正、逆指标,如商业网点密度,可以是千人还有正、逆指标,如商业网点密度,可以是千人/个,个,还可以是个还可以是个/千人。千人。n正指标,指标数值越大越好的指标,如国内生产总值、正指标,指标数值越大越好的指标,如国内生产总值、财政收入、各种产量、农民和职工收入等指标财政收入、各种产量、农民和
18、职工收入等指标。n逆指标,指标数值越小越好的指标。逆指标,指标数值越小越好的指标。n阅读:如何正确掌握统计学中的正指标和逆指标阅读:如何正确掌握统计学中的正指标和逆指标 11/11/202229第二节第二节 统计数据的来源统计数据的来源本节需要把握两个问题:本节需要把握两个问题:一、统计数据的直接来源:源于直一、统计数据的直接来源:源于直接调查和科学实验;接调查和科学实验;二、统计数据的间接来源:源于别二、统计数据的间接来源:源于别人调查或实验的数据。人调查或实验的数据。11/11/202230一、统计数据的直接来源一、统计数据的直接来源n把握四个问题:把握四个问题:n1、统计调查的分类;、统
19、计调查的分类;n2、统计调查方式;、统计调查方式;n3、数据的搜集方法;、数据的搜集方法;n4、调查方案设计。、调查方案设计。11/11/202231统计调查统计调查n统计调查是按照预定的目的和统计任统计调查是按照预定的目的和统计任务,运用科学的调查方法,有组织、务,运用科学的调查方法,有组织、有计划地对调查对象进行资料搜集的有计划地对调查对象进行资料搜集的过程。过程。11/11/2022321 1、统计调查的分类、统计调查的分类n(1)按调查范围分为全面、非全面)按调查范围分为全面、非全面调查。调查。n全面调查是对调查对象的所有单位进全面调查是对调查对象的所有单位进行调查,如普查、全面统计报
20、表;非行调查,如普查、全面统计报表;非全面调查是对调查对象中的一部分单全面调查是对调查对象中的一部分单位进行调查,如抽样调查、重点调查、位进行调查,如抽样调查、重点调查、典型调查。典型调查。11/11/2022331 1、统计调查的分类、统计调查的分类n(2)按时间分为连续按时间分为连续(经常经常)性调查和不连续性调查和不连续性调查。性调查。n连续连续(经常经常)性调查是指随着现象的变化,连性调查是指随着现象的变化,连续不断地进行调查登记。例如,统计报表制续不断地进行调查登记。例如,统计报表制度。度。n不连续性调查是指间隔一段较长的时间进行不连续性调查是指间隔一段较长的时间进行一次性调查一次性
21、调查。如普查、典型调查、重点调查。如普查、典型调查、重点调查等一般是不连续性调查。等一般是不连续性调查。11/11/2022341 1、统计调查的分类、统计调查的分类 n(3)按组织形式可分为定期报表和专门调按组织形式可分为定期报表和专门调查。查。n定期报表制度是按国家统一规定的表式和内定期报表制度是按国家统一规定的表式和内容,定期地向各级领导机构报送统计资料的容,定期地向各级领导机构报送统计资料的一种形式。一种形式。n专门调查是为某一专题研究而组织的专项调专门调查是为某一专题研究而组织的专项调查,一般地,普查、抽样调查和典型调查等查,一般地,普查、抽样调查和典型调查等可以是专门调查。可以是专
22、门调查。11/11/202235 2 2、统计调查方式、统计调查方式n统计调查是统计数据的主要来源。统计调查是统计数据的主要来源。n我国统计法第十条规定我国统计法第十条规定“统计调查统计调查应以周期性普查为基础,经常性抽应以周期性普查为基础,经常性抽样调查为主体,必要的统计报表、样调查为主体,必要的统计报表、重点调查、综合分析等为补充,搜重点调查、综合分析等为补充,搜集、整理基本统计资料集、整理基本统计资料”。11/11/2022362 2、统计调查方式、统计调查方式n(1)普查:普查:A、它是专门组织的一次性全面调它是专门组织的一次性全面调查,它主要是用以调查某些不能或不宜用定期查,它主要是
23、用以调查某些不能或不宜用定期的全面报表搜集的统计资料,以此掌握国情、的全面报表搜集的统计资料,以此掌握国情、国力。国力。n目前,经国务院批准的周期性的普查项目有:目前,经国务院批准的周期性的普查项目有:人口普查、工业普查、农业普查、第三产业普人口普查、工业普查、农业普查、第三产业普查(每十年一次,分别在逢查(每十年一次,分别在逢0、3、5、7年份进年份进行)和基本统计单位(每五年一次,在逢行)和基本统计单位(每五年一次,在逢1、6年份进行)等。年份进行)等。11/11/2022372 2、统计调查方式、统计调查方式nB、它适合于特定目的、对象的调查,用它适合于特定目的、对象的调查,用于搜集现象
24、时点上的数量,目的掌握现象于搜集现象时点上的数量,目的掌握现象的基本全貌。的基本全貌。nC、特点:它是一次性的或周期性的;规、特点:它是一次性的或周期性的;规定统一的标准调查时间;数据较准确、规定统一的标准调查时间;数据较准确、规范化程度高;但适用的对象较狭窄。范化程度高;但适用的对象较狭窄。11/11/2022382 2、统计调查方式、统计调查方式n我国在我国在1953年、年、1964年、年、1980年、年、1990年、年、2000年年进行了五次人口普查,进行了五次人口普查,1992年进行了第三产业普年进行了第三产业普查,查,1995年进行了工业普查,年进行了工业普查,1997年进行了农业年
25、进行了农业普查。普查。n普查方式:自上而下组织专门的普查机构,派专普查方式:自上而下组织专门的普查机构,派专门人员对调查单位进行直接登记或利用企业、机门人员对调查单位进行直接登记或利用企业、机关、事业单位本身的组织系统和内部原始记录、关、事业单位本身的组织系统和内部原始记录、报表资料进行填报,或根据清库盘点进行登记和报表资料进行填报,或根据清库盘点进行登记和调整。调整。11/11/2022392 2、统计调查方式、统计调查方式n(2)抽样调查)抽样调查nA、它是从调查对象的总体中随机抽取它是从调查对象的总体中随机抽取一部分单位作为样本进行调查,根据样一部分单位作为样本进行调查,根据样本调查结果
26、来推断总体数量特征的一种本调查结果来推断总体数量特征的一种非全面调查方法。非全面调查方法。11/11/2022402 2、统计调查方式、统计调查方式n(2)抽样调查)抽样调查nB、特点:遵循随机原则,排除主特点:遵循随机原则,排除主观干扰;以样本数据推断总体;误观干扰;以样本数据推断总体;误差可以事先估计并加以控制。差可以事先估计并加以控制。11/11/2022412 2、统计调查方式、统计调查方式n(2)抽样调查)抽样调查nC、优点:经济性;时效性高;适优点:经济性;时效性高;适应面广,特别适合对特殊现象的调应面广,特别适合对特殊现象的调查,如一些具有破坏性的质量检验;查,如一些具有破坏性的
27、质量检验;准确性高。准确性高。11/11/2022422 2、统计调查方式、统计调查方式n(3)统计报表:)统计报表:A、它是一种重要方它是一种重要方式,已形成较完备的统计报表制度,式,已形成较完备的统计报表制度,它是按国家规定,自上而下的布置,它是按国家规定,自上而下的布置,自下而上逐级提供统计数据的一种调自下而上逐级提供统计数据的一种调查方式。它以原始数据为基础,按统查方式。它以原始数据为基础,按统一表式、指标、报送时间、程序填报。一表式、指标、报送时间、程序填报。11/11/2022432 2、统计调查方式、统计调查方式n(3)统计报表)统计报表nB、分类:按调查范围分为全面、分类:按调
28、查范围分为全面、非全面报表;按报送时间分为日、非全面报表;按报送时间分为日、月、季、年报等;按报送范围分为月、季、年报等;按报送范围分为国家、部门、地方统计报表。国家、部门、地方统计报表。11/11/2022442 2、统计调查方式、统计调查方式n(4)其他方式)其他方式nA、重点调查:是从调查对象中选择少数重重点调查:是从调查对象中选择少数重点单位进行调查。重点单位是指在所要调查点单位进行调查。重点单位是指在所要调查的数量特征上占有较大比重的单位的数量特征上占有较大比重的单位(符合符合80/20原理原理)。即只对总体中为数不多但影响。即只对总体中为数不多但影响颇大(其标志值在总体标志总量中所
29、占比重颇大(其标志值在总体标志总量中所占比重很大)的重点单位进行研究的一种非全面调很大)的重点单位进行研究的一种非全面调查。查。11/11/2022452 2、统计调查方式、统计调查方式n可以是重点地区(产区、市场、出口基地等),可以是重点地区(产区、市场、出口基地等),也可是重点企业,主要产品或商品,视情况而也可是重点企业,主要产品或商品,视情况而定。定。n如对几个产量大的钢铁企业鞍钢、宝钢、首钢如对几个产量大的钢铁企业鞍钢、宝钢、首钢等进行重点调查,以便了解全国的钢铁产量。等进行重点调查,以便了解全国的钢铁产量。n特点:人、财、物较少,及时掌握总体基本情特点:人、财、物较少,及时掌握总体基
30、本情况及其发展变化的基本趋势。况及其发展变化的基本趋势。11/11/2022462 2、统计调查方式、统计调查方式n(4)其他方式)其他方式nB、典型调查:是从调查对象中选择一个或几个典型调查:是从调查对象中选择一个或几个少数有代表性的单位进行全面深入细致的调查,少数有代表性的单位进行全面深入细致的调查,目的揭示事物的本质和规律。它主要是一种定性目的揭示事物的本质和规律。它主要是一种定性研究,适合对新生事物进行调查,可与全面调查研究,适合对新生事物进行调查,可与全面调查相结合。相结合。n典型单位数目的多少要依据总体单位之间的差异典型单位数目的多少要依据总体单位之间的差异程度而定,差异大,数目多
31、,或者进行程度而定,差异大,数目多,或者进行“划类取划类取典典”,差异小,数目少。,差异小,数目少。11/11/2022473 3、数据的搜集方法、数据的搜集方法n(1)访问调查:又称派员调查,)访问调查:又称派员调查,它是调查者与被调查者面对面地交它是调查者与被调查者面对面地交谈获得资料。方式有标准式和非标谈获得资料。方式有标准式和非标准式,又称结构式和非结构式。准式,又称结构式和非结构式。n(2)邮寄调查:通过邮寄或其他)邮寄调查:通过邮寄或其他方式将问卷送至被调查者。它是一方式将问卷送至被调查者。它是一种标准化调查,特点是非直接交流种标准化调查,特点是非直接交流11/11/202248
32、3 3、数据的搜集方法、数据的搜集方法n(3)电话调查:是调查人员利用电话与)电话调查:是调查人员利用电话与受访者进行语言交流。特点时效快,费受访者进行语言交流。特点时效快,费用低,但注意问题要明确且不宜多。用低,但注意问题要明确且不宜多。n(4)座谈会:又称集体访谈法,适用搜)座谈会:又称集体访谈法,适用搜集与研究课题有密切关系的少数人员的集与研究课题有密切关系的少数人员的意见,注意人数不宜多,意见,注意人数不宜多,6到到10人,且是人,且是专家或有经验的人。专家或有经验的人。11/11/202249 3 3、数据的搜集方法、数据的搜集方法n(5)个别深度访问:一次只有一名受访)个别深度访问
33、:一次只有一名受访者,是一种无结构的个人访问,常用于者,是一种无结构的个人访问,常用于动机研究,最宜研究较隐秘的问题。动机研究,最宜研究较隐秘的问题。n(6)其他方式:直接观察法、采访法、)其他方式:直接观察法、采访法、实验调查法、网上调查法等实验调查法、网上调查法等11/11/2022504 4、调查方案设计、调查方案设计n调查方案是指导整个调查过程的纲领性调查方案是指导整个调查过程的纲领性文件,它包括:文件,它包括:n(1)调查目的()调查目的(Why):):它是调查的它是调查的具体目标,明确调查要解决什么问题,具体目标,明确调查要解决什么问题,即为什么调查。它应简明扼要。例如,即为什么调
34、查。它应简明扼要。例如,第五次人口普查的目的。第五次人口普查的目的。11/11/2022514 4、调查方案设计、调查方案设计n(2)调查对象和调查单位()调查对象和调查单位(Who)nA、调查对象是根据调查目的确定的调查研调查对象是根据调查目的确定的调查研究的总体或调查范围。究的总体或调查范围。n调查单位是构成调查对象中的每一个单位,调查单位是构成调查对象中的每一个单位,它是调查项目和指标的承担者或载体,是它是调查项目和指标的承担者或载体,是我们搜集数据、分析数据的基本单位。我们搜集数据、分析数据的基本单位。11/11/2022524 4、调查方案设计、调查方案设计n(2)调查对象和调查单位
35、()调查对象和调查单位(Who)nB、实际调查中调查单位可以是全部或部分单实际调查中调查单位可以是全部或部分单位。位。nC、与填报单位的区别:后者是负责向上报告与填报单位的区别:后者是负责向上报告调查内容、提交统计资料的单位,与调查单位调查内容、提交统计资料的单位,与调查单位有时一致,有时不一致。如进行工业企业职工有时一致,有时不一致。如进行工业企业职工基本情况普查,调查单位是工业企业每一个职基本情况普查,调查单位是工业企业每一个职工,填报单位是工业企业。工,填报单位是工业企业。11/11/2022534 4、调查方案设计、调查方案设计n(3)调查项目和调查表)调查项目和调查表nA、调查项目:
36、明确调查什么。项目的设调查项目:明确调查什么。项目的设置注意:含义明确、答案形式、取得资料置注意:含义明确、答案形式、取得资料的可能性、项目的多少。是调查的具体内的可能性、项目的多少。是调查的具体内容,可以是单位的数量特征,也可以是单容,可以是单位的数量特征,也可以是单位的某种属性或品质特征。位的某种属性或品质特征。11/11/2022544 4、调查方案设计、调查方案设计n(3)调查项目和调查表)调查项目和调查表nB、调查表:将调查项目以表格形式调查表:将调查项目以表格形式表示,包括表头、表体、表外附加。表示,包括表头、表体、表外附加。n调查表又分为单一表和一览表,前者调查表又分为单一表和一
37、览表,前者只有一个单位,项目较多,后者有若只有一个单位,项目较多,后者有若干个单位,项目较少。干个单位,项目较少。11/11/202255 4 4、调查方案设计、调查方案设计n(3)调查项目和调查表)调查项目和调查表nC、市场调查中的问卷:它由一系列问题、市场调查中的问卷:它由一系列问题、备选答案、说明、码表组成,结构由开头、备选答案、说明、码表组成,结构由开头、主体和背景组成。主体和背景组成。n问卷设计内容包括:提问问题的设计、问问卷设计内容包括:提问问题的设计、问题答案、提问顺序、问卷版面格式设计等。题答案、提问顺序、问卷版面格式设计等。11/11/2022564 4、调查方案设计、调查方
38、案设计n(4)调查方法)调查方法n是搜集数据的具体方式,应明确是全是搜集数据的具体方式,应明确是全面还是非全面调查,非全面调查还应面还是非全面调查,非全面调查还应明确是抽样调查、重点调查还是典型明确是抽样调查、重点调查还是典型调查。调查。11/11/2022574 4、调查方案设计、调查方案设计n(5)调查时间:包括数据所属时间和调查)调查时间:包括数据所属时间和调查期限。前者应明确调查的是时期或时点数据,期限。前者应明确调查的是时期或时点数据,后者指调查工作的时限(从开始到结束的时后者指调查工作的时限(从开始到结束的时间长度,包括调查时间、处理时间、分析和间长度,包括调查时间、处理时间、分析
39、和完成调查报告的时间)。完成调查报告的时间)。n如第四次人口普查数据所属时间是如第四次人口普查数据所属时间是“1990年年7月月1日日0时时”,工作时限是,工作时限是1990年年7月月1日至日至7月月10日完成普查的登记工作。日完成普查的登记工作。11/11/2022584 4、调查方案设计、调查方案设计n(6)调查的组织和实施)调查的组织和实施n包括调查人员的选择、组织和培训;包括调查人员的选择、组织和培训;调查表、问卷、调查员手册的印刷;调查表、问卷、调查员手册的印刷;调查经费来源和开支预算等。调查经费来源和开支预算等。11/11/202259二、统计数据的间接来源二、统计数据的间接来源n
40、主要是公开出版或公开报道的数据,主要是公开出版或公开报道的数据,有些是尚未公开的,来源于国家和有些是尚未公开的,来源于国家和地方的统计部门以及各种报刊等媒地方的统计部门以及各种报刊等媒体。体。n使用二手数据经济方便,但应注意使用二手数据经济方便,但应注意数据的含义、计算口径、方法,使数据的含义、计算口径、方法,使用时注明数据的来源。用时注明数据的来源。11/11/202260二、统计数据的间接来源二、统计数据的间接来源1.统计部门和政府部门公布的有关资料,统计部门和政府部门公布的有关资料,如各类统计年鉴如各类统计年鉴2.各类经济信息中心、信息咨询机构、专各类经济信息中心、信息咨询机构、专业调查
41、机构等提供的数据业调查机构等提供的数据3.各类专业期刊、报纸、书籍所提供的资各类专业期刊、报纸、书籍所提供的资料料4.各种会议,如博览会、展销会、交易会各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关及专业性、学术性研讨会上交流的有关资料资料5.从互联网或图书馆查阅到相关资料从互联网或图书馆查阅到相关资料 中国统计出版社11/11/202261提供统计数据的部分政府网站提供统计数据的部分政府网站中国政府及相关机构中国政府及相关机构 网址网址数据内容数据内容国家统计局国家统计局http:/统计年鉴、统计月统计年鉴、统计月报等报等国务院发展研究中心国务院发展研究中心信息网信息网
42、http:/宏观经济、财经、宏观经济、财经、货币金融等货币金融等 中国经济信息网中国经济信息网http:/经济信息及各类网经济信息及各类网站站华通数据中心华通数据中心http:/国家统计局授权的国家统计局授权的数据中心数据中心中国决策信息网中国决策信息网http:/决策知识及案例决策知识及案例三农数据网三农数据网http:/三农信息、论坛及三农信息、论坛及相关网站相关网站11/11/202262提供统计数据的部分政府网站提供统计数据的部分政府网站美国政府机构美国政府机构 网址网址数据内容数据内容人口普查局人口普查局http:/www.census.gov人口和家庭等人口和家庭等联邦储备局联邦储
43、备局http:/www.bog.frb.fed.us货币供应、信誉、货币供应、信誉、汇率等汇率等预算编制办公室预算编制办公室http:/www.whitehouse.gov/omb财政收入、支出、财政收入、支出、债券等债券等商务部商务部http:/www.doc.gov商业、工业等商业、工业等11/11/202263第三节第三节 统计数据的质量统计数据的质量n在统计的整个工作过程都会遇到一在统计的整个工作过程都会遇到一个减少误差、提高数据质量的问题,个减少误差、提高数据质量的问题,统计数据的质量控制问题贯穿于统统计数据的质量控制问题贯穿于统计工作全过程。把握两个问题:计工作全过程。把握两个问题
44、:n一、误差的分类;一、误差的分类;n二、误差的控制。二、误差的控制。11/11/202264一一、误差的分类、误差的分类抽抽样样 误误 差差抽 样 框 误 差回 答 误 差无 回 答 误 差调 查 员 误 差非非抽抽 样样 误误 差差数数据据 的的 误误 差差11/11/202265一一、误差的分类、误差的分类n1、抽样误差抽样误差(sampling error)由于抽样由于抽样的随机性所带来的误差的随机性所带来的误差(1)所有样本可能的结果与总体真值之间)所有样本可能的结果与总体真值之间的平均性差异的平均性差异(2)影响抽样误差大小的因素)影响抽样误差大小的因素q样本量的大小样本量的大小q
45、总体的变异性总体的变异性11/11/202266一一、误差的分类、误差的分类n2、非抽样误差、非抽样误差(non-sampling error)相对于相对于抽样误差而言抽样误差而言(1)除抽样误差之外的,由于其他原因造成)除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异的样本观察结果与总体真值之间的差异(2)存在于所有的调查之中)存在于所有的调查之中概率抽样,非概率抽样,全面性调查概率抽样,非概率抽样,全面性调查(3)有抽样框误差、回答误差、无回答误差、)有抽样框误差、回答误差、无回答误差、调查员误差、测量误差调查员误差、测量误差11/11/202267抽样框误差抽样框误差
46、n抽样框又称抽样框又称“抽样框架抽样框架”、“抽样结构抽样结构”,是指对可以选择作为样本的总体单位列出名是指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结册或排序编号,以确定总体的抽样范围和结构。设计出了抽样框后,便可采用抽签的方构。设计出了抽样框后,便可采用抽签的方式或按照随机数表来抽选必要的单位数。若式或按照随机数表来抽选必要的单位数。若没有抽样框,则不能计算样本单位的概率,没有抽样框,则不能计算样本单位的概率,从而也就无法进行概率选样。从而也就无法进行概率选样。n好的抽样框应做到:完整而不重复。好的抽样框应做到:完整而不重复。11/11/202268抽样框误差抽
47、样框误差n常见的抽样框:大学学生花名册、城市黄页里的常见的抽样框:大学学生花名册、城市黄页里的电话列表、工商企业名录、街道派出所里居民户电话列表、工商企业名录、街道派出所里居民户籍册、意向购房人信息册籍册、意向购房人信息册。在没有现成的名。在没有现成的名单的情况下,可由调查人员自己编制。应该注意单的情况下,可由调查人员自己编制。应该注意的是,在利用现有的名单作为抽样框时,要先对的是,在利用现有的名单作为抽样框时,要先对该名录进行检查,避免有重复、遗漏的情况发生。该名录进行检查,避免有重复、遗漏的情况发生。以提高样本对总体的代表性。以提高样本对总体的代表性。n例如:要从例如:要从10000名职工
48、中抽出名职工中抽出200名组成一个样名组成一个样本,则本,则10000名职工的名册,就是抽样框。名职工的名册,就是抽样框。11/11/202269抽样框误差抽样框误差n抽样框误差便是因不准确或不完整的抽样框而抽样框误差便是因不准确或不完整的抽样框而引起的误差。问题是,从包含抽样误差的抽样引起的误差。问题是,从包含抽样误差的抽样框中抽取的样本有时无法正确地代表调研目标框中抽取的样本有时无法正确地代表调研目标的实际情况,这就存在抽样框误差。举个例子,的实际情况,这就存在抽样框误差。举个例子,以电话号码薄作为抽样框,在对某地区所有住以电话号码薄作为抽样框,在对某地区所有住户进行的某种意向调查时,就存
49、在着抽样框误户进行的某种意向调查时,就存在着抽样框误差。差。11/11/202270二、误差的控制二、误差的控制1、抽样误差可计算和控制、抽样误差可计算和控制2、非抽样误差的控制、非抽样误差的控制q调查员的挑选调查员的挑选q调查员的培训调查员的培训q督导员的调查专业水平督导员的调查专业水平q调查过程控制调查过程控制n调查结果进行检验、评估调查结果进行检验、评估n现场调查人员进行奖惩的制度现场调查人员进行奖惩的制度11/11/202271第四节第四节 统计数据的整理统计数据的整理n本节需把握三个问题:本节需把握三个问题:n一、数据的预处理一、数据的预处理n二、数据分组与频数分布二、数据分组与频数
50、分布n三、次数分配的图示和类型三、次数分配的图示和类型11/11/202272一、数据的预处理一、数据的预处理n把握两个问题:把握两个问题:n1、数据的审核、筛选;、数据的审核、筛选;n2、数据的排序。、数据的排序。11/11/2022731 1、数据的审核、筛选、数据的审核、筛选n(1)数据的审核)数据的审核nA、对原始数据,审核完整性和准确对原始数据,审核完整性和准确性。完整性指调查单位是否遗漏、性。完整性指调查单位是否遗漏、项目是否齐全等;准确性指数据是项目是否齐全等;准确性指数据是否真实、是否错误等。否真实、是否错误等。n方法是逻辑检查和计算检查。方法是逻辑检查和计算检查。11/11/