1、 统计数据来源(统计调查)统计数据来源(统计调查)统计资料的整理统计资料的整理第二章第二章 统计数据的描述统计数据的描述 统计数据的来源统计数据的来源数据来源数据来源直接来源直接来源间接来源间接来源试验试验出版物出版物(或者网上等或者网上等)问卷调查问卷调查观察观察1 1、统计部门和政府部门公布的有关资料,如各类、统计部门和政府部门公布的有关资料,如各类统计年鉴统计年鉴2 2、各类经济信息中心、信息咨询机构、专业调查、各类经济信息中心、信息咨询机构、专业调查机构等提供的数据机构等提供的数据3 3、各类专业期刊、报纸、书籍所提供的资料、各类专业期刊、报纸、书籍所提供的资料4 4、各种会议,如博览
2、会、展销会、交易会及专业、各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料性、学术性研讨会上交流的有关资料5 5、从互联网或图书馆查阅到的相关资料、从互联网或图书馆查阅到的相关资料 在收集二手资料时要注意的几个问题:在收集二手资料时要注意的几个问题:o数据是谁搜集的?数据是谁搜集的?o为什么目的而搜集的?为什么目的而搜集的?o数据是怎样搜集的?数据是怎样搜集的?o什么时候搜集的?什么时候搜集的?o在引用间接资料的时候要注明资料来源。在引用间接资料的时候要注明资料来源。二、统计数据的直接来源二、统计数据的直接来源o 统计调查(主要用来取得社会经济数据)统计调查(主要用来取
3、得社会经济数据)o 科学试验(主要用来取得自然科学数据科学试验(主要用来取得自然科学数据)一、统计调查的意义和要求统计数据资料是通过统计调查来搜集的。统计数据资料是通过统计调查来搜集的。统计调查是统计调查是调查主体对被调查客体的一种认识活动,调查主体对被调查客体的一种认识活动,是统是统计工作的第二个阶段。它是以搜集占有大量的数字资料为计工作的第二个阶段。它是以搜集占有大量的数字资料为主体信息。主体信息。统计调查所搜集的数据资料既包括统计调查所搜集的数据资料既包括原始资料又包括次级资原始资料又包括次级资料。料。统计调查在整个统计工作过程中担负着提供基础资料的统计调查在整个统计工作过程中担负着提供
4、基础资料的任务,任务,是统计整理和统计分析的基础和前提是统计整理和统计分析的基础和前提,所有的统,所有的统计分析和统计研究都是在进行统计调查搜集原始资料的计分析和统计研究都是在进行统计调查搜集原始资料的基础上进行的。因此,基础上进行的。因此,统计调查取得的资料质量直接影统计调查取得的资料质量直接影响统计工作最终成果的质量。响统计工作最终成果的质量。统计调查的要求:统计调查的要求:准确性:准确性:指统计资料符合实际情况,准确可靠,严指统计资料符合实际情况,准确可靠,严格遵守格遵守中华人民共和国统计法中华人民共和国统计法,杜绝任何,杜绝任何形式的弄虚作假,统计调查所收集资料的准确形式的弄虚作假,统
5、计调查所收集资料的准确性是衡量统计工作质量的重要标志。性是衡量统计工作质量的重要标志。可以说准可以说准确性是统计工作的生命。确性是统计工作的生命。及时性及时性:按照统计调查方案中规定的时间完成各项:按照统计调查方案中规定的时间完成各项调查资料的收集和上报工作,及时满足各部门调查资料的收集和上报工作,及时满足各部门对统计资料的需求。对统计资料的需求。如果做不到及时,一方面会贻误统计整理的时间,如果做不到及时,一方面会贻误统计整理的时间,使决策机关不能及时得到所需信息。另一方面使决策机关不能及时得到所需信息。另一方面落后于事物发展的统计资料即便准确、完整也落后于事物发展的统计资料即便准确、完整也没
6、有多大的现实价值。没有多大的现实价值。统计调查的要求:统计调查的要求:全面性全面性:根据统计调查的目的,对统计调查单:根据统计调查的目的,对统计调查单位的资料,不重复不遗漏的进行搜集。位的资料,不重复不遗漏的进行搜集。如果如果收集的资料残缺不全,就不能反映调查对象收集的资料残缺不全,就不能反映调查对象的全貌,的全貌,就会给统计整理和统计分析带来困就会给统计整理和统计分析带来困难,从而直接影响统计工作的质量。难,从而直接影响统计工作的质量。效益性效益性:整个统计工作都应注重效益,争取以:整个统计工作都应注重效益,争取以最少的投入获得最大的产出。在统计调查的最少的投入获得最大的产出。在统计调查的各
7、个环节都应该测算其成本费用。各个环节都应该测算其成本费用。在保证质在保证质量的前提下尽可能的降低成本费用量的前提下尽可能的降低成本费用。普普 查查抽样调查抽样调查典型调查典型调查重点调查重点调查全面统计报表制度全面统计报表制度按调查范围分按调查范围分全面调查全面调查:就是对调查对象的全部单位无:就是对调查对象的全部单位无一例外的进行调查。一例外的进行调查。非全面调查非全面调查:对调查对象的一部分单位进:对调查对象的一部分单位进行调查。行调查。全面调查和非全面调查的划分是以调查时全面调查和非全面调查的划分是以调查时调查对调查对象所包含单位的多少为依据,并不是以最后取得象所包含单位的多少为依据,并
8、不是以最后取得的资料是不是全面为依据。的资料是不是全面为依据。按调查时间是否连续分:按调查时间是否连续分:经常性调查与一次性调查经常性调查与一次性调查经常性调查:随着调查对象的发展变化,连续地经常性调查:随着调查对象的发展变化,连续地进行登记。进行登记。经常性调查是为了观察总体现象在一经常性调查是为了观察总体现象在一段时间内的数量变化。段时间内的数量变化。一次性调查:间隔一个相当长的时间所作的调查。一次性调查:间隔一个相当长的时间所作的调查。一般是为了对总体现象的一般是为了对总体现象的一定时点上一定时点上的状态进行的状态进行调查。调查。按调查组织方式不同按调查组织方式不同统计报表制度与专门调查
9、统计报表制度与专门调查统计报表制度:统计报表制度:是依照国家有关法律的规定,自是依照国家有关法律的规定,自上而下统一布置,以一定的上而下统一布置,以一定的原始记录和统计台账原始记录和统计台账为依据,按照统一的表式、统一的指标项目、统为依据,按照统一的表式、统一的指标项目、统一的报送时间和报送程序,自下而上逐级提供统一的报送时间和报送程序,自下而上逐级提供统计资料的统计调查方式。它是我国长期的统计调计资料的统计调查方式。它是我国长期的统计调查行之有效的一种调查方式。查行之有效的一种调查方式。专门调查:为某一特定目的而组织的一次性调查。专门调查:为某一特定目的而组织的一次性调查。统计报表制度的特点
10、:统计报表制度的特点:1、统计报表制度是根据国民经济和社会发展宏观、统计报表制度是根据国民经济和社会发展宏观管理需要而周密设计的,项目和指标都力求规范管理需要而周密设计的,项目和指标都力求规范和完善、使调查资料具有可靠的基础,保证资料和完善、使调查资料具有可靠的基础,保证资料的统一性,便于在全国范围内汇总。的统一性,便于在全国范围内汇总。2、依靠行政手段执行的报告制度,要求严格按照、依靠行政手段执行的报告制度,要求严格按照规定的时间和程序上报,具有规定的时间和程序上报,具有100%回收率回收率3、采用层层上报、逐级汇总的方式,可以满足各、采用层层上报、逐级汇总的方式,可以满足各级管理部门对统计
11、资料的需要。级管理部门对统计资料的需要。统计报表的分类:统计报表的分类:1、按调查对象范围的不同、按调查对象范围的不同2、按照报送周期不同、按照报送周期不同3、按报送的方式不同、按报送的方式不同4、按填报单位不同(基层报表和综合报表)、按填报单位不同(基层报表和综合报表)5、按照实施的范围不同、按照实施的范围不同填报统计报表的资料来源:填报统计报表的资料来源:1、原始记录、原始记录是指企事业单位对其各项生产活动和业务活动的过程是指企事业单位对其各项生产活动和业务活动的过程和结果,通过一定的表格形式,用数字或文字所做的和结果,通过一定的表格形式,用数字或文字所做的最初记载。最初记载。2、统计台账
12、、统计台账把把原始记录或有关汇总表上的资料原始记录或有关汇总表上的资料,用表式按时间顺,用表式按时间顺序逐期进行登记汇总与整理的一种表册。它是为系统序逐期进行登记汇总与整理的一种表册。它是为系统地登记整理和积累统计资料而设置的一种专用表册。地登记整理和积累统计资料而设置的一种专用表册。总体单位总体单位调查单位调查单位报表制度报表制度可以全面调查,但可以全面调查,但通常是调查限定规通常是调查限定规模以上的总体单位模以上的总体单位普查:是专门组织的一次性的全面调查。它主要用于搜集某些不能够或不适宜用定期统计报表搜集的统计资料。普查普查o 特点特点1 1:普查是一次性调查,其主要用来调查属于:普查是
13、一次性调查,其主要用来调查属于一定时点上一定时点上的社会经济现象的总量。由于普查涉及的社会经济现象的总量。由于普查涉及面广、调查单位多,需要耗费大量的人力、物力、面广、调查单位多,需要耗费大量的人力、物力、财力和时间。财力和时间。o 特点特点2 2:普查一般需要规定统一的标准时间,以避:普查一般需要规定统一的标准时间,以避免调查数据的重复或遗漏,以保证普查结果的准确免调查数据的重复或遗漏,以保证普查结果的准确性。性。o 特点特点3 3:普查数据一般比较准确、全面、系统,规:普查数据一般比较准确、全面、系统,规范化程度也高。范化程度也高。o 特点特点4 4:普查的适用范围比较窄,一般只适用于最:
14、普查的适用范围比较窄,一般只适用于最基本、最重要的全面情况的调查。基本、最重要的全面情况的调查。普查的特点普查的特点我国的普查有:我国的普查有:人口普查(逢人口普查(逢0 0)、工业普查(逢)、工业普查(逢2 2)、农业普)、农业普查(逢查(逢6 6)、经济普查(逢)、经济普查(逢3 3、8 8)等。)等。总体单位总体单位调查单位调查单位普普 查查对全部单位对全部单位进行调查进行调查重点调查:重点调查:是在调查对象中选择在被调查项目的总量中占是在调查对象中选择在被调查项目的总量中占有绝大比重的重点单位进行调查,有绝大比重的重点单位进行调查,通过这些少数重点通过这些少数重点单位的调查,就可以了解
15、调查对象的基本情况。单位的调查,就可以了解调查对象的基本情况。重点调查重点调查这些单位数目不多,这些单位数目不多,但其调查标志值在总体的标志值总和但其调查标志值在总体的标志值总和中占有相当大的比重,能大体反映总体的基本情况中占有相当大的比重,能大体反映总体的基本情况。重点调查的调查单位易于确定,它的选择很少受主观因素重点调查的调查单位易于确定,它的选择很少受主观因素的影响,调查单位较少、花费少、并且能及时获得所的影响,调查单位较少、花费少、并且能及时获得所需资料。需资料。总体单位总体单位调查单位调查单位重点调查重点调查只调查重点单位(单位只调查重点单位(单位数不多但其标志量占总数不多但其标志量
16、占总体标志总量比重较大的体标志总量比重较大的单位)单位)典型调查:它是根据调查任务,在对所研究的现象进行初典型调查:它是根据调查任务,在对所研究的现象进行初步和全面分析的基础上,步和全面分析的基础上,有意识地有意识地选出具有代表性的选出具有代表性的典型单位,进行深入细致的调查研究,以认识事物的典型单位,进行深入细致的调查研究,以认识事物的本质和规律性的一种调查研究方法。本质和规律性的一种调查研究方法。典型调查典型调查它是一种节省时间、人力、而又轻巧、灵活的调查方式,它是一种节省时间、人力、而又轻巧、灵活的调查方式,常被用来研究某些比较复杂的专门问题。常被用来研究某些比较复杂的专门问题。典型单位
17、的选择:典型单位的选择:择中选典法、择优(劣)选典法、划类选典法择中选典法、择优(劣)选典法、划类选典法总体单位总体单位调查单位调查单位典型调查典型调查对典型单位进行调对典型单位进行调查,典型单位的选查,典型单位的选择并不一定按规模择并不一定按规模o 抽样调查:抽样调查:从总体中随机抽取一部分单位作为样本进行从总体中随机抽取一部分单位作为样本进行调查,调查,并根据样本调查结果来推断总体特征的数并根据样本调查结果来推断总体特征的数据收集方法据收集方法。具有经济性、时效性强、适应面广、。具有经济性、时效性强、适应面广、准确性高等特点。准确性高等特点。抽样调查是非全面调查,调查单位按随机原抽样调查是
18、非全面调查,调查单位按随机原则抽取,则抽取,存在抽样误差,但抽样误差可以事先计存在抽样误差,但抽样误差可以事先计算并控制,算并控制,调查目的在于推断反映调查现象总体调查目的在于推断反映调查现象总体的全面数据资料,是一种应用很广的科学调查方的全面数据资料,是一种应用很广的科学调查方式。式。总体单位总体单位调查单位调查单位抽样调查抽样调查按随机原则选择调按随机原则选择调查单位,各单位被查单位,各单位被选中的机会相同。选中的机会相同。三种非全面调查的比较 调查的种类调查的种类 确确 定定 调调 查查 单单 位位 的的 方方 法法 调查的目的调查的目的 重点调查重点调查 重点单位在全部单位中只是很小重
19、点单位在全部单位中只是很小一部分,但它们的标志值在标志总量一部分,但它们的标志值在标志总量中却占绝大的比重。(客观性)中却占绝大的比重。(客观性)重点单位的标志值重点单位的标志值 较大的较大的全部单位的标志总量全部单位的标志总量 比重比重(定量调查)(定量调查)只是要求掌握总只是要求掌握总体的基本情况。体的基本情况。典型调查典型调查 在对所研究的对象进行初步分析在对所研究的对象进行初步分析的基础上,有意识地确定最具有代表的基础上,有意识地确定最具有代表性的单位。(主观性、定性调查)性的单位。(主观性、定性调查)了解新生事物的了解新生事物的发展趋势和规律。发展趋势和规律。抽样调查抽样调查 按照随
20、机原则从调查对象中抽取按照随机原则从调查对象中抽取一部分单位作为样本。一部分单位作为样本。根据样本的数据根据样本的数据对总体做出具有对总体做出具有一定可靠程度的一定可靠程度的推算。推算。统计调查方案设计统计调查方案设计确定调查目的;确定调查目的;(为什么调查)(为什么调查)调查对象调查对象与与调查单位调查单位;(向谁调查)(向谁调查)调查项目与调查项目与调查表调查表;(调查什么)(调查什么)调查的时间和期限;调查的时间和期限;制定调查工作的组织实施计划。制定调查工作的组织实施计划。确定调查目的确定调查目的o 确定调查目的:是指通过某项调查,需要弄清确定调查目的:是指通过某项调查,需要弄清的情况
21、和需要解决的问题。的情况和需要解决的问题。如果调查目的不明,就无法确定向谁调查,调查什如果调查目的不明,就无法确定向谁调查,调查什么内容等,其后果必然导致调查活动的盲目性。么内容等,其后果必然导致调查活动的盲目性。调查对象和调查单位调查对象和调查单位o 调查对象:是指需要调查的现象总体,该总体调查对象:是指需要调查的现象总体,该总体是由许多性质相同的调查单位组成。是由许多性质相同的调查单位组成。o 调查单位:是指所要调查的具体单位,它是所要登记调查单位:是指所要调查的具体单位,它是所要登记的标志的承担者。的标志的承担者。o 报告单位:亦称填报单位,它是负责向上报告调查内报告单位:亦称填报单位,
22、它是负责向上报告调查内容、提交统计资料的单位。容、提交统计资料的单位。调查单位和报告单位,有时是一致的(工业企调查单位和报告单位,有时是一致的(工业企业普查);有时是不一致的(工业企业设备普查)业普查);有时是不一致的(工业企业设备普查)调查项目:是所要调查的具体内容,包括调查单位所须调查项目:是所要调查的具体内容,包括调查单位所须登记的标志及其他有关情况。完全由调查目的、任务和登记的标志及其他有关情况。完全由调查目的、任务和调查对象的性质特点所决定。调查对象的性质特点所决定。在每一次统计调查中,为了研究调查总体的特在每一次统计调查中,为了研究调查总体的特征、数量表现等,征、数量表现等,需要设
23、计相应的指标和指需要设计相应的指标和指标体系。标体系。调查项目就是为了取得特定的统计调查项目就是为了取得特定的统计指标和指标体系的具体值而设置的。指标和指标体系的具体值而设置的。调查项目调查项目在拟定调查项目时,应该遵循少而精的原则,并注意一在拟定调查项目时,应该遵循少而精的原则,并注意一下几个问题:下几个问题:o 所选择的调查项目必须是能够取得确切的资所选择的调查项目必须是能够取得确切的资料料o 每一个项目应该有确切的涵义和统一的解释每一个项目应该有确切的涵义和统一的解释o 应该紧紧围绕调查目的和任务确定调查项目。应该紧紧围绕调查目的和任务确定调查项目。调查项目调查表格:是将各个调查项目按照
24、一定的顺序排列在一调查表格:是将各个调查项目按照一定的顺序排列在一定的表格上。定的表格上。一览表:一览表:是把许多调查单位填写在一张表上。是把许多调查单位填写在一张表上。(调查项目不多时,采用该类表式。其(调查项目不多时,采用该类表式。其 特点是简便,便于合计和核对数据)特点是简便,便于合计和核对数据)单一表:单一表:是每个调查单位填写一张表。是每个调查单位填写一张表。(调查项目较多时,采用该类表式。其特点(调查项目较多时,采用该类表式。其特点是可容纳较多的标志,便于整理分类)是可容纳较多的标志,便于整理分类)调查表格调查表格调查时间和调查期限调查时间和调查期限o 调查时间:调查时间:是指调查
25、资料所属的时间是指调查资料所属的时间。(即:标准时间、客观时间)(即:标准时间、客观时间)o 调查期限:调查期限:是指进行调查工作的时限是指进行调查工作的时限。(包括搜集资料和报送资料(包括搜集资料和报送资料 的工作所需的时间)的工作所需的时间)统计整理统计整理 根据统计研究的目的和客观现象的内在根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把数据分特点,按某个标志(或几个标志)把数据分别列入不同的组内。别列入不同的组内。o“分分”:就是把同一总体中性质不同的总体单位:就是把同一总体中性质不同的总体单位分配到不同的组里,突出组与组之间的差异性。分配到不同的组里,突出组与组之间
26、的差异性。o“组组”:就是把同一总体中性质相同的总体单位:就是把同一总体中性质相同的总体单位归并到同一组里,突出组内的同质性。归并到同一组里,突出组内的同质性。穷尽原则穷尽原则 互斥原则互斥原则o 穷尽原则:就是使总体中的每一个单位都应穷尽原则:就是使总体中的每一个单位都应有组可归。有组可归。o 互斥原则:就是使总体中的任何一个单位只互斥原则:就是使总体中的任何一个单位只能归属于某一个组,而不能同时或可能归属能归属于某一个组,而不能同时或可能归属于几个于几个 组。组。穷尽原则穷尽原则 互斥原则互斥原则例例1:从业人员按文化程度分组:从业人员按文化程度分组 小学毕业小学毕业 中学毕业(含中专)中
27、学毕业(含中专)大学毕业大学毕业 文盲或识字不多文盲或识字不多小学毕业小学毕业中学毕业(含中专)中学毕业(含中专)大专毕业大专毕业大学及大学以上大学及大学以上 ()()统计分组的重要性和作用统计分组的重要性和作用在保证调查资料质量的前提下,在保证调查资料质量的前提下,统计分组的正统计分组的正确与否,是决定整个统计研究成败的关键。确与否,是决定整个统计研究成败的关键。分组标志的选择原则:分组标志的选择原则:根据统计研究的目的和要求来选择分组标志根据统计研究的目的和要求来选择分组标志在若干标志中选择最重要的标志作为分组标志在若干标志中选择最重要的标志作为分组标志根据社会经济现象所处的具体历史条件选
28、择分组标志根据社会经济现象所处的具体历史条件选择分组标志按分组标志的多少不同按分组标志的多少不同简单分组简单分组复合分组复合分组按分组标志的性质不同按分组标志的性质不同品质标志分组品质标志分组数量标志分组数量标志分组例例 1 为了了解某地区银行存款的构成,可以选用为了了解某地区银行存款的构成,可以选用存款性质、期限两个标志分别进行分组:存款性质、期限两个标志分别进行分组:按存款性质分组按存款性质分组 企业存款企业存款 储蓄存款储蓄存款 财政性存款财政性存款按存款期限分组按存款期限分组 活期存款活期存款 定期存款定期存款简单简单分组分组复合分组存款同时按其性质及期限分组存款同时按其性质及期限分组
29、 企业存款企业存款 活期活期 定期定期 储蓄存款储蓄存款 活期活期 定期定期 财政性存款财政性存款 活期活期 定期定期例例2 企业职工按工龄分组:企业职工按工龄分组:5年以下年以下 510年年 1015年年 1520年年 20年以上年以上品质标志分组数量标志分组二、统计分组的方法二、统计分组的方法 1、品质分组的方法、品质分组的方法 2、数量分组的方法、数量分组的方法(1)单项式分组)单项式分组(2)组距式分组:等距分组、异距分组)组距式分组:等距分组、异距分组品质标志分组的方法:o 按品质标志分组,有的比较简单,分组的标志一经确按品质标志分组,有的比较简单,分组的标志一经确定,组的名称和组数
30、也随之确定了。如:人口按性别定,组的名称和组数也随之确定了。如:人口按性别分组,就分为分组,就分为“男男”与与“女女”两组。两组。o 按品质标志分组,有的就比较复杂。如:国民经济的按品质标志分组,有的就比较复杂。如:国民经济的部门划分,就有三次产业分类、行业分类、机构部门部门划分,就有三次产业分类、行业分类、机构部门分类分类。这种比较复杂的分类。这种比较复杂的分类,一般会有国家统计局和一般会有国家统计局和国家标准局统一制定分类标志,代码等。国家标准局统一制定分类标志,代码等。在我国的统计实践工作中,对于重要的品质标志分组,在我国的统计实践工作中,对于重要的品质标志分组,规定了统一的统计分类标准
31、或分类目录,以统一分规定了统一的统计分类标准或分类目录,以统一分类的口径,诸如类的口径,诸如工业产品分类目录工业产品分类目录、农作物农作物分类目录分类目录、工业部门分类目录工业部门分类目录等。等。数量标志分组数量标志分组按数量标志分组按数量标志分组是按表现总体数量特征的标志进行的分组。是按表现总体数量特征的标志进行的分组。这种分组的目的是这种分组的目的是通过事物在数量上的差异来反映事物通过事物在数量上的差异来反映事物在性质上的区别。在性质上的区别。按数量标志分组主要有两种形式,即单项式分组或组距式按数量标志分组主要有两种形式,即单项式分组或组距式分组。分组。单项式分组是在单项式分组是在数量标志
32、的变化范围不大、总体单位数又数量标志的变化范围不大、总体单位数又不多的情况下不多的情况下,每个变量列为一个组的分组。,每个变量列为一个组的分组。组距式分组是指总体按数量标志分组后,每组由一个表示组距式分组是指总体按数量标志分组后,每组由一个表示一定变动范围或表示一定距离的两个变量值所形成的分一定变动范围或表示一定距离的两个变量值所形成的分组,用一个区间表示出来。组,用一个区间表示出来。组限组限组限是指每组两端的数值,其中每组的起点数值称为下组限是指每组两端的数值,其中每组的起点数值称为下限,终点的数值称为上限。限,终点的数值称为上限。组限的形式与变量的特点密切相关。组限的形式与变量的特点密切相
33、关。如果分组标志是连如果分组标志是连续变量,组限一般用重合式;如果分组标志是离散变续变量,组限一般用重合式;如果分组标志是离散变量,组限一般用不重合式。量,组限一般用不重合式。所谓重合式就是相邻两组中,前一组的上限与后一组的下所谓重合式就是相邻两组中,前一组的上限与后一组的下限数值相重,只是形式上的相重,实际上两组之间是没限数值相重,只是形式上的相重,实际上两组之间是没有重复的。有重复的。一般按一般按“上限不在内上限不在内”原则处理。原则处理。所谓不重合式指前一组的上限与后一组的下限,两值紧密所谓不重合式指前一组的上限与后一组的下限,两值紧密相连而又不相重复。相连而又不相重复。数量标志分组的方
34、法:o 分组时各组分组时各组数量界限数量界限的确定必须能反映事的确定必须能反映事物物质质的差别。的差别。o 根据被研究的现象总体的数量特征,采用适根据被研究的现象总体的数量特征,采用适当的当的分组形式分组形式,确定相应的组距、组限。,确定相应的组距、组限。分组的形式如下:1、单项式分组、单项式分组:一个变量值代表一组。一般适用于离散变量且一个变量值代表一组。一般适用于离散变量且变异范围较小。变异范围较小。例:工人按日产量分组:例:工人按日产量分组:日产量(件)人数20 821102225233024 725 22、组距式分组:、组距式分组:用一段距离代表一组。一般适用于连续变量或变异范围用一段
35、距离代表一组。一般适用于连续变量或变异范围较大的离散变量。较大的离散变量。例:学生按学习成绩分组例:学生按学习成绩分组 (1 1)、等距分组:各组的组距都相等。适)、等距分组:各组的组距都相等。适用于标志值的变动比较均匀的情况下。用于标志值的变动比较均匀的情况下。(2 2)、异距分组:各组的组距不完全相)、异距分组:各组的组距不完全相同。同。按 成 绩 分 组 人 数 60分以下2 60707 708011 809012 90分以上8 合 计40按年龄分组组距不满周岁13岁246岁2712岁56064岁46579岁148099岁9100岁以上第三次人口普查年龄的异距分组组距分组的组限确定:o
36、间断组距分组间断组距分组o 连续组距分组连续组距分组 如:工厂按完成任务的程度分组:如:工厂按完成任务的程度分组:100%以以下,下,100%110%,110%120%,120%以上。以上。在连续组距的分组时,相邻两组的上、在连续组距的分组时,相邻两组的上、下限是重叠的,如下限是重叠的,如110%。统计中按。统计中按“上限上限不在内不在内”原则处理。即,原则处理。即,110%统计到作为统计到作为下限的第三组而不是统计到作为上限的第二下限的第三组而不是统计到作为上限的第二组。组。分组形式的总结:品质标志分组品质标志分组数量标志分组数量标志分组单项式分组单项式分组组距式分组组距式分组等距式分组等距
37、式分组异距式分组异距式分组统计分组统计分组3、统计分组中的几个概念统计分组中的几个概念 上限、下限、组距、组中值、全距、开口组、闭上限、下限、组距、组中值、全距、开口组、闭口组口组o 组限组限 组距组距本组上限本组下限本组上限本组下限 组中值组中值(上限下限)(上限下限)/2o 全距(全距(R)=数列中的最大值数列中的最大值最小值最小值o 组数组数=全距全距/组距组距上限:一组中的较大值。上限:一组中的较大值。下限:一组中的较小值下限:一组中的较小值分组中的几个基本概念:(2)o 开口组与闭口组:开口组与闭口组:开口组开口组:缺少上限或下限的组。:缺少上限或下限的组。如:如:60分以下分以下;
38、6070;8090;90分以上分以上。闭口组:上、下限都齐备的组。闭口组:上、下限都齐备的组。如:如:7080分;分;500600公斤;公斤;90100岁岁o1、组数的多少与组距的大小有关。在全距一定时,组距大,、组数的多少与组距的大小有关。在全距一定时,组距大,组数就少;组距小,组数就多。组数就少;组距小,组数就多。o2、组距的确定要根据事物的数量特征来确定。组距如果过大,、组距的确定要根据事物的数量特征来确定。组距如果过大,就会使性质不同的单位归并到了同一组里(破坏了组内的同质就会使性质不同的单位归并到了同一组里(破坏了组内的同质性);组距过小,就会使同一性质的单位分到了不同的组里性);组
39、距过小,就会使同一性质的单位分到了不同的组里(破坏了组与组之间的差异性)。(破坏了组与组之间的差异性)。o3、决定组数的多少,并无规则可循,必须凭借经验和对研究、决定组数的多少,并无规则可循,必须凭借经验和对研究对象的认识作出判断。有一个经验公式可供大家参考:对象的认识作出判断。有一个经验公式可供大家参考:【美国美国学者斯特杰斯创用学者斯特杰斯创用】o n=1+3.3 lg No n:组数 N:总体单位数o 开口组如何计算组中值:开口组如何计算组中值:缺少上限:缺少上限:1、计算假定上限:、计算假定上限:假定上限假定上限=下限下限+相邻组的组距相邻组的组距 如:假定上限如:假定上限=90+10
40、=100(分);(分);2、计算组中值:、计算组中值:组中值组中值=(90+100)2=95(分)(分)缺少下限:缺少下限:1、计算假定下限:、计算假定下限:假定下限假定下限=上限相邻组的组距上限相邻组的组距 如:假定下限如:假定下限=6010=50(分);(分);2、计算组中值:、计算组中值:组中值组中值=(50+60)2=55(分)(分)三、次数分布三、次数分布次数分布:是指总体按一个或几个标志分组以后,所形成的按次数分布:是指总体按一个或几个标志分组以后,所形成的按一定顺序排列总体各单位在各组的分布。它是在统计分组的基一定顺序排列总体各单位在各组的分布。它是在统计分组的基础上,将总体的所
41、有单位按组归类,并把所有的组及其单位数础上,将总体的所有单位按组归类,并把所有的组及其单位数按一定顺序排列而成。按一定顺序排列而成。分布数列的两个要素:分布数列的两个要素:一是总体按某标志所分的组;一是总体按某标志所分的组;二是各组所出现的单位数,即频数二是各组所出现的单位数,即频数 亦称次数(一般用亦称次数(一般用 f f 来表示)。来表示)。三、次数分布次数分布是统计整理的一种重要形式,也是统计描述和统计分次数分布是统计整理的一种重要形式,也是统计描述和统计分析的一种重要方法。它可以表明总体的分布特征和内部结构,析的一种重要方法。它可以表明总体的分布特征和内部结构,并据以研究总体中某标志的
42、平均水平及其变动规律。并据以研究总体中某标志的平均水平及其变动规律。次数分布的种类次数分布的种类按分组标志的不同分为按分组标志的不同分为品质数列和变量数列品质数列和变量数列品质数列:对总体按品质标志分组所形成的数列,品质数列由两部品质数列:对总体按品质标志分组所形成的数列,品质数列由两部分组成:一是各组名称;二是各组单位数,包括次数和频率。分组成:一是各组名称;二是各组单位数,包括次数和频率。变量数列:对总体按数量标志分组所形成的分布数列,变量数列由变量数列:对总体按数量标志分组所形成的分布数列,变量数列由说明总体各组的标志值和各组次数两个要素组成。说明总体各组的标志值和各组次数两个要素组成。
43、次数分配表xfn1iiiff频率性质:性质:f介于介于01之间之间 各组频率之和等于各组频率之和等于1例例1:对学生购买饮料品牌的调查:对学生购买饮料品牌的调查:代码代码饮料品牌饮料品牌 x频数(人)频数(人)f频率()频率()1可口可乐可口可乐15302百事可乐百事可乐11223蒙牛蒙牛9184娃哈哈娃哈哈6125伊利伊利918合计合计50100例例2:某百货公司日商品销售额分布数列表:某百货公司日商品销售额分布数列表:按销售额分组按销售额分组 x(万元)(万元)频数频数f(天)(天)频率()频率()2530410.03035615.035401537.54045922.54550615.0
44、合计合计40100次数分布的表示方法次数分布的表示方法简单次数分布表:将分组形成的次数分布结果用表格形式表示出来。简单次数分布表:将分组形成的次数分布结果用表格形式表示出来。累计次数分布表(向上累计、向下累计)累计次数分布表(向上累计、向下累计)简单次数分布图简单次数分布图 -单项式数列次数分布图单项式数列次数分布图(以变量为横轴,以次数为纵轴)(以变量为横轴,以次数为纵轴)-组距式数列次数分布图(直方图、折线图)组距式数列次数分布图(直方图、折线图)直方图:直方图:(以变量为横轴,以次数为纵轴)(以变量为横轴,以次数为纵轴)(以各组组距为宽,各组次数为高,这样各组直方图面积(以各组组距为宽,
45、各组次数为高,这样各组直方图面积的大小就表示各组分配次数的多少。)的大小就表示各组分配次数的多少。)累计次数分布图:根据累计次数分布表资料即可绘制累计次数分布图。累计次数分布图:根据累计次数分布表资料即可绘制累计次数分布图。4、折线图、折线图1.折线图也称频数多边形图折线图也称频数多边形图2.是在直方图的基础上,把直方图顶部的中点是在直方图的基础上,把直方图顶部的中点(组中值组中值)用直线连接起来,再把原来的直方图抹掉用直线连接起来,再把原来的直方图抹掉3.折线图的两个终点要与横轴相交,具体的做法是折线图的两个终点要与横轴相交,具体的做法是n第一个矩形的顶部中点通过竖边中点(即该组频数一半第一
46、个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴中点连接到横轴n折线图下所围成的面积与直方图的面积相等,二者所表折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的示的频数分布是一致的四、累计频数(频率)四、累计频数(频率)包括向上累积和向下累积。按销售额分按销售额分组组 x(万元)(万元)频数频数f(天)(天)频率频率()()向上累计向上累计向下累计向下累计频数频数频率频率频频数数频率频率2530410.0410.0401003035615.01025.03690.035
47、401537.52562.53074.04045922.534831537.54550615.040100615.0合计合计401003、直方图 809010011012013004812分组数据的图示(折线图的绘制)折线图与直方图下的面积相等!809010011012013004812四、频数分布的类型:钟型分布、U U 型分 布、J J 型分布。o 钟型分布的钟型分布的特征:特征:两头小,中两头小,中间大。即靠间大。即靠近中间的变近中间的变量值分布的量值分布的次数多,靠次数多,靠近两边的变近两边的变量值分布的量值分布的次数少。次数少。o U 型分布的特征:型分布的特征:两头大,中间小。两头
48、大,中间小。即靠近中间的变即靠近中间的变量值分布的次数量值分布的次数少,靠近两边的少,靠近两边的变量值分布的次变量值分布的次数多。数多。o 正正J型分布的型分布的特征:特征:次数随次数随着变量的增大着变量的增大而增多。例:而增多。例:投资额按利润投资额按利润率的大小分布。率的大小分布。o反反J型分布的型分布的特征:特征:次数随次数随着变量的增着变量的增大而减少。大而减少。例:产品产例:产品产量的增加,量的增加,产品单位成产品单位成本下降。本下降。人有了知识,就会具备各种分析能力,人有了知识,就会具备各种分析能力,明辨是非的能力。明辨是非的能力。所以我们要勤恳读书,广泛阅读,所以我们要勤恳读书,广泛阅读,古人说古人说“书中自有黄金屋。书中自有黄金屋。”通过阅读科技书籍,我们能丰富知识,通过阅读科技书籍,我们能丰富知识,培养逻辑思维能力;培养逻辑思维能力;通过阅读文学作品,我们能提高文学鉴赏水平,通过阅读文学作品,我们能提高文学鉴赏水平,培养文学情趣;培养文学情趣;通过阅读报刊,我们能增长见识,扩大自己的知识面。通过阅读报刊,我们能增长见识,扩大自己的知识面。有许多书籍还能培养我们的道德情操,有许多书籍还能培养我们的道德情操,给我们巨大的精神力量,给我们巨大的精神力量,鼓舞我们前进鼓舞我们前进。
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。