1、统计学统计学1。第一章第一章 绪论绪论1、统计学:关于数据资料搜集、整理、分统计学:关于数据资料搜集、整理、分析、推断的理论和方法。析、推断的理论和方法。(复数复数)2、统计工作:对数据资料搜集、整理、分、统计工作:对数据资料搜集、整理、分析、推断的过程。析、推断的过程。(单数单数)3、统计资料:各种数据资料的总称。、统计资料:各种数据资料的总称。(单单数数)一、统计一、统计(Statistics)的含义的含义理论与实践的关系第一节第一节 统计的特点及分科统计的特点及分科2。统计的含义之一统计的含义之一统计学统计学第一章第一章 绪论绪论3。二、统计学的特点二、统计学的特点n1、数量性、数量性n
2、2、总体性总体性n3、差异性差异性n4.随机性三、统计学的分类统计学的分类理论统计学和应用统计学理论统计学和应用统计学统计学统计学描述统计学和推断统计学描述统计学和推断统计学统计学的数学原理研究应用于某特定领域统计方法数据资料的整理、显示以及概括统计规律用样本数据推算总体数据4。描述统计(descriptive statistics)1.内容内容n搜集数据n整理数据n展示数据n描述性分析2.目的目的n描述数据特征n找出数据的基本规律5。推断统计(inferential statistics)1.内容内容参数估计假设检验2.目的目的对总体特征作出推断6。统计的应用领域7。统计的应用领域8。统计的
3、应用领域9。四、统计学与其它学科的关系四、统计学与其它学科的关系n1、统计学与数学的关系、统计学与数学的关系(1)统计学研究的量是具体的量,而数学)统计学研究的量是具体的量,而数学研究的量是抽象的量。研究的量是抽象的量。(2)统计学运用归纳推理,而数学运用演)统计学运用归纳推理,而数学运用演绎推理。绎推理。n2、统计学与计算机的关系、统计学与计算机的关系 计算机是统计数据处理的工具。计算机是统计数据处理的工具。10。第二节第二节 统计学的基本概念统计学的基本概念总体与总体单位总体与总体单位标志和变量标志和变量指标及指标体系指标及指标体系样本及统计推断样本及统计推断统计学的基本概念统计学的基本概
4、念11。一、一、总体与总体单位总体与总体单位n统计总体统计总体(Population)就是根据一定目的确定的所要研究对象的全体就是根据一定目的确定的所要研究对象的全体。n总体单位是组成总体的个别单位。总体单位是组成总体的个别单位。n总体中的总体单位数称为总体容量总体中的总体单位数称为总体容量(Population size)。用。用N表示。表示。同质性同质性差异性差异性 大量性大量性有限总体:总体单位数目有限有限总体:总体单位数目有限无限总体:总体单位数目无限无限总体:总体单位数目无限总体的特点总体的特点总体的分类总体的分类12。总体、总体单位总体、总体单位总体、总体单位总体、总体单位统计学统
5、计学第一章第一章 绪论绪论13。二、标志和变量n(一)标志是反映总体单位特征的名称。(一)标志是反映总体单位特征的名称。1、标志的分类、标志的分类 n品质标志:不能用数量表示品质标志:不能用数量表示n数量标志:用数量表示数量标志:用数量表示n不变标志:标志表现相同不变标志:标志表现相同n可变标志:标志表现不同可变标志:标志表现不同14。男男汉族汉族佛教佛教无党派无党派43岁岁182cm75公斤公斤品品质质标标志志文文字字表表述述数数量量标标志志数数据据表表述述15。品质标志品质标志数量标志数量标志 标志和变量标志和变量不变标志不变标志变异标志变异标志统计学统计学第一章第一章 绪论绪论16。品质
6、标志品质标志数量标志数量标志 标志和变量标志和变量不变标志不变标志变异标志变异标志统计学统计学第一章第一章 绪论绪论17。定比测量(尺度、指标)定比测量(尺度、指标)定类测量(尺度、指标)定类测量(尺度、指标)定序测量(尺度、指标)定序测量(尺度、指标)定距测量(尺度、指标)定距测量(尺度、指标)统计学统计学第一章第一章 绪论绪论18。定定类类尺尺度度按现象性质差异进行的辨别按现象性质差异进行的辨别与区分。测量结果形成与区分。测量结果形成定类定类变量变量或或定类指标。定类指标。定类变量或指标确切的值是定类变量或指标确切的值是以文字表述以文字表述的,可以用数值的,可以用数值标识,但仅起标签作用。
7、标识,但仅起标签作用。定类变量或指标的定类变量或指标的各类别间各类别间是平等是平等的,没有高低、大小、的,没有高低、大小、优劣之分。优劣之分。性别、种族、运动项目等等性别、种族、运动项目等等19。定定序序尺尺度度按现象顺序差异进行的辨别按现象顺序差异进行的辨别与区分。测量结果形成与区分。测量结果形成定序定序变量变量或或定序指标定序指标。定序变量或指标确切的定序变量或指标确切的值是值是以文字表述以文字表述的,也可以用数的,也可以用数值标识,也仅起标签作用。值标识,也仅起标签作用。定序变量或指标定序变量或指标各类别间有各类别间有高低优劣之分高低优劣之分,不能随意排,不能随意排列。列。20。大学生大
8、学生中学生中学生小学生小学生21。定定距距尺尺度度按现象绝对数量差异进行的按现象绝对数量差异进行的辨别与区分。测量结果形成辨别与区分。测量结果形成定距变量定距变量或或定距指标定距指标。定距变量或指标的定距变量或指标的值以数字值以数字表述表述,有,有计量单位计量单位,可以进,可以进行行加减运算加减运算。定距变量或指标各类别间自定距变量或指标各类别间自然有大小之分,但然有大小之分,但没有绝对没有绝对的零点的零点,不能乘除计算。,不能乘除计算。22。天气预报:沈阳:最高温度天气预报:沈阳:最高温度3,最低,最低7 大连:最高温度大连:最高温度6,最低,最低2两地最高温度相差两地最高温度相差3沈阳最低
9、温度较大连最低温度低沈阳最低温度较大连最低温度低5大连最高温度是沈阳最高温度的大连最高温度是沈阳最高温度的2倍倍 温度温度23。1971年出生年出生 30岁岁1986年出生年出生 15岁岁甲甲乙乙二人年龄二人年龄 之差:之差:19861971=15岁岁 或或 3015=15岁岁二人年龄之比:二人年龄之比:3015=2(倍)(倍)19861971=1.0076(倍)(倍)24。定定比比尺尺度度按现象绝对差异与相对差异按现象绝对差异与相对差异进行的辨别与区分。测量结进行的辨别与区分。测量结果形成果形成定比变量定比变量或或定比指标定比指标。定比变量或指标确切的定比变量或指标确切的值也值也以数字表述,
10、有计量单位以数字表述,有计量单位,可以进行加减运算。可以进行加减运算。定比变量或指标定比变量或指标有绝对意义有绝对意义上的零点,既可以加减运算,上的零点,既可以加减运算,也可以乘除运算也可以乘除运算。25。第一,决定数据的整理、显示方法第一,决定数据的整理、显示方法第二,决定数据的分析方法第二,决定数据的分析方法第三,决定计算机的处理方法第三,决定计算机的处理方法统计测量尺度的作用:统计测量尺度的作用:26。高高 多多 大大27。甲、乙有生命甲、乙有生命很低很低不能计算,不能计算,只能判断只能判断、甲、乙有生命甲、乙有生命定类测量定类测量甲为中年人,乙甲为中年人,乙为少年人。为少年人。较低较低
11、、+、甲、乙有生命甲、乙有生命甲生命时间较乙长甲生命时间较乙长甲比乙大甲比乙大45岁岁甲甲 年龄为乙的年龄为乙的4倍倍定比测量定比测量统计学统计学第二章第二章 统计数据的搜集统计数据的搜集测量测量精度精度计算计算方法方法信息信息数量数量某甲某某甲某乙的生乙的生命现象命现象28。29。宗教、种族、民族、性别、宗教、种族、民族、性别、党派、国别、职业等等品质方党派、国别、职业等等品质方面的差异面的差异定类测量定类测量对于人的主观态对于人的主观态度,定序尺度可度,定序尺度可能是最好的方法能是最好的方法30。定序测量定序测量定距测量定距测量定比测量定比测量顺序性差异顺序性差异顺序性差异、顺序性差异、绝
12、对差异距离绝对差异距离顺序性差异、顺序性差异、绝对差异距离、绝对差异距离、相对差异相对差异文盲半文盲文盲半文盲博士研究生博士研究生31。在自然或社会经济领域里,在自然或社会经济领域里,单纯的定距变量是很少的,单纯的定距变量是很少的,绝大多数定距变量同时也绝大多数定距变量同时也是定比变量。是定比变量。定距测量与定比测量的区别定距测量与定比测量的区别只在理论上有意义,在实际只在理论上有意义,在实际工作中常将二者归为一类。工作中常将二者归为一类。32。n(二)变量:说明总体或个体某种特征的概念。(二)变量:说明总体或个体某种特征的概念。变量值:变量的具体数值。例如,工资是变量,而工资的具体取值变量值
13、:变量的具体数值。例如,工资是变量,而工资的具体取值600、800、1200则是变量值。则是变量值。定性变量:不能用数量表示。定性变量:不能用数量表示。n按形式分按形式分定量变量:能用数量表示。定量变量:能用数量表示。确定性变量:指在一定条件下取值确定的变量确定性变量:指在一定条件下取值确定的变量。n按性质分按性质分随机变量:取值不确定的变量。随机变量:取值不确定的变量。连续型变量:变量值连续不断。连续型变量:变量值连续不断。n按变量值的形式按变量值的形式离散型变量:变量值以整数位断开。离散型变量:变量值以整数位断开。如性别如年龄、工资不可一一列举可一一列举33。三、指标及指标体系n(一)指标
14、:统计指标是反映统计总体数量特征的概念。(一)指标:统计指标是反映统计总体数量特征的概念。n(二)指标与标志的区别与联系。(二)指标与标志的区别与联系。区别区别主要是:主要是:1.标志是反映总体单位的属性和特征,而指标则是标志是反映总体单位的属性和特征,而指标则是 反映总体的数量特征。反映总体的数量特征。2.标志有不能用数值表示的品质标志与能用数值表示的数量标志两种,而标志有不能用数值表示的品质标志与能用数值表示的数量标志两种,而指标都是可用数值表示的,没有不能用数值表示的指标。指标都是可用数值表示的,没有不能用数值表示的指标。二者的二者的联系联系则是有些统计指标数值是从总体单位的数量标志值汇
15、总而来的。则是有些统计指标数值是从总体单位的数量标志值汇总而来的。n(三)指标体系(三)指标体系将一系列相互联系、相互补充共同说明一个总体各方面特征的指标将一系列相互联系、相互补充共同说明一个总体各方面特征的指标组成整体就构成统计指标体系。组成整体就构成统计指标体系。34。5701999年末年末大连市大连市总人口总人口万人万人时间时间限制限制空间空间限制限制指标名称指标名称具体具体数值数值计量计量单位单位计算方法计算方法统计学统计学第一章第一章 绪论绪论35。四、样本及统计推断n(一)样本(一)样本(Sample):从总体中抽取出来,用来代表总体的个体的集:从总体中抽取出来,用来代表总体的个体
16、的集合体。合体。n样本容量样本容量(Sample size):样本中所含个体的数量:样本中所含个体的数量,用,用n表示。表示。n大于大于或等于或等于50的样本为大样本。的样本为大样本。n(二二)统计推断:根据样本资料对总体的分布状况和分布特征进行推断。统计推断:根据样本资料对总体的分布状况和分布特征进行推断。n 样本样本 总体总体n n 统计推断统计推断总体的缩影36。第二章 统计数据的搜集与整理n第一节 统计调查n一、统计调查的要求一、统计调查的要求统计调查是根据统计研究的目的,向调查单位搜集统计资料的过程搜集统计资料的过程。原始资料:未经加工整理,只能说明个体特征。次级资料:经过加工整理,
17、一定程度能说明总体特征。统计调查的要求:调查资料37。二、统计调查的种类n(一)按调查对象包括的(一)按调查对象包括的范围不同范围不同,分为,分为全面调查和非全面调查全面调查和非全面调查全面调查:对总体中的所有总体单位进行调查。全面调查:对总体中的所有总体单位进行调查。例如,人口普查。例如,人口普查。非全面调查:只调查总体中的一部分总体单位。非全面调查:只调查总体中的一部分总体单位。例如,抽样调查例如,抽样调查。n(二)按调查登记的(二)按调查登记的时间是否连续时间是否连续,分为,分为经常性调查和一次性调查。经常性调查和一次性调查。经常性调查:对总体的状况进行连续不断的登记。经常性调查:对总体
18、的状况进行连续不断的登记。一次性调查:对总体的状况间隔一段时间调查一次。一次性调查:对总体的状况间隔一段时间调查一次。n(三)按调查的(三)按调查的组织方式的不同组织方式的不同,分为,分为统计报表和专门调查。统计报表和专门调查。统计报表是国家统计系统和各个业务部门为了定期取得全面的统计统计报表是国家统计系统和各个业务部门为了定期取得全面的统计资料而采用的一种调查方式资料而采用的一种调查方式。专门调查是指为了了解和研究某种情况或某项问题而专门组织的调查专门调查是指为了了解和研究某种情况或某项问题而专门组织的调查。针对时期现象针对时点现象38。n 统计调查的分类不是互相排斥的,而是从不同角度对同一
19、调查进行不同的分类,它们是相互联系、相互交叉的。例如普查是一种专门组织的调查,又是一次性的调查,也是全面的调查。n全面调查 由调查经费、调查期限决定n非全面调查n经常性调查 由所调查指标的时间特征决定n一次性调查39。三、统计调查方案设计三、统计调查方案设计n(一)确定调查的任务和目的。(一)确定调查的任务和目的。n(二)确定调查对象和调查单位。(二)确定调查对象和调查单位。n(三)拟定调查提纲和编制调查表。(三)拟定调查提纲和编制调查表。单一表单一表:一份表上只登记一个调查单位的调查项目:一份表上只登记一个调查单位的调查项目 调查表调查表 一览表:一份调查表同时登记若干个调查单位的调查项目一
20、览表:一份调查表同时登记若干个调查单位的调查项目 n(四)确定调查的方式和方法(四)确定调查的方式和方法n(五)确定调查时间和调查期限:(五)确定调查时间和调查期限:调查时间是调查资料所属的时间;调调查时间是调查资料所属的时间;调 查期限是调查工作的起至时间。查期限是调查工作的起至时间。n(六)制定调查的组织实施计划(六)制定调查的组织实施计划总总 体体总体单位总体单位40。四、统计调查组织形式四、统计调查组织形式n(一)统计报表(一)统计报表 统计报表是按照国家相关法律的规定,按照统一的表式、统一的指统计报表是按照国家相关法律的规定,按照统一的表式、统一的指标、统一的报送时间和报送程序自上而
21、下统一布置,自下而上地逐级定标、统一的报送时间和报送程序自上而下统一布置,自下而上地逐级定期提供基本统计资料的一种调查方式。期提供基本统计资料的一种调查方式。n统计报表的种类:统计报表的种类:l按调查范围不同,统计报表可以分为全面统计报表和非全面统计报表。按调查范围不同,统计报表可以分为全面统计报表和非全面统计报表。l按报送时间不同,统计报表可以分为日报、旬报、月报、季报、半年报按报送时间不同,统计报表可以分为日报、旬报、月报、季报、半年报和年报统计报表和年报统计报表。l按报送范围不同,统计报表可以分为国家报表、部门报表、地方报表。按报送范围不同,统计报表可以分为国家报表、部门报表、地方报表。
22、l按填报单位不同,统计报表可以分为基层报表和综合报表。按填报单位不同,统计报表可以分为基层报表和综合报表。41。(二)普查n概念:普查是专门组织的一次性的全面调查。n特点:1、普查是一次性的定期调查。一般要规定统一的标准时间。如 我国第五次人口普查的标准时间为2000年11月1日0时。2、普查是一种全面调查。它比其他任何一种调查形式更能掌握大量、详细、全面的统计资料。花费的人力、物力很大。3、普查是专门组织的调查,所以其数据一般比较准确,规范化程度也较高。搜集有关国情、搜集有关国情、国力的基本数据国力的基本数据42。(三)重点调查(三)重点调查n概念:只对总体中的重点单位进行调查。n 单位数少
23、单位数少 n 调查的标志值在总体标志总量中占有很大的比重调查的标志值在总体标志总量中占有很大的比重 n(四)典型调查(四)典型调查n概念:有意识地从总体中选出少数几个具有代表性的典型单位进行深入细致的调查研究。适宜变量值分布极适宜变量值分布极不均衡的总体不均衡的总体凭主观抽取凭主观抽取调查单位调查单位43。(五)抽样调查(五)抽样调查n概念:概念:按照随机原则从总体中抽取一部分单位作为样本,并根据样本按照随机原则从总体中抽取一部分单位作为样本,并根据样本 指标数值推算总体指标数值的调查方式。指标数值推算总体指标数值的调查方式。n特点:特点:1、样本单位是按随机原则抽取的。、样本单位是按随机原则
24、抽取的。2、要用样本数据推算总体数据。、要用样本数据推算总体数据。3、抽样误差可以计算并事先计算并加以控制。、抽样误差可以计算并事先计算并加以控制。n适用范围适用范围:1、对一些不可能或不必要进行全面调查的客观现象。、对一些不可能或不必要进行全面调查的客观现象。2、对普查资料进行必要的修正。、对普查资料进行必要的修正。3、抽样调查可以用于工业生产过程的质量控制。、抽样调查可以用于工业生产过程的质量控制。4、利用抽样调查还可以对总体的某种假设进行检验、利用抽样调查还可以对总体的某种假设进行检验 44。抽样调查的组织方式抽样调查的组织方式n1、简单随机抽样按随机原则直接从总体N个单位中抽取n个单位
25、作为样本,保证总体中每个单位在抽选时都有同等的中选机会。n2、分层随机抽样先对总体各单位按主要标志加以分组,然后再从各组中按随机原则抽取一定单位构成样本。n3、系统随机抽样是先将总体各单位按某一标志进行排队,然后按固定顺序和间隔来抽取样本。排队可按无关标志,也可按有关标志。例如,从200个单位中抽取10个单位,间隔为20(200/10)即将200个单位10等份,每等份抽取1个单位,从第一等份中随机抽取1个单位,以后的样本单位均按等距抽取。n 4、整群随机抽样是先将总体分成若干群,然后以群为单位从中随机抽取若干群,对中选群的全部单位进行全面调查。45。抽样调查的组织方式简单随机抽样分层抽样等距抽
26、样整群抽样先分群,以群为单位随机抽取先排队,按固定间隔抽取先分组,从各组中随机抽取事先不做任何加工直接抽取46。全面统计报表全面统计报表 (定期、全面调查)全面调查全面调查 普查普查 (全面、一次性、专门调查)统计调查的组织方式统计调查的组织方式 抽样调查抽样调查 (随机抽取调查单位)典型调查典型调查 非全面调查非全面调查 (凭主观抽取调查单位)重点调查重点调查 (只调查重点单位)47。五、统计调查的具体方法五、统计调查的具体方法n(一)直接观察法(一)直接观察法调查者到现场直接对调查对象进行观察、计数、计量。资料较准确、生调查者到现场直接对调查对象进行观察、计数、计量。资料较准确、生动,但需
27、要花费较大的人力、财力和时间动,但需要花费较大的人力、财力和时间。n(二)采访法(二)采访法采访法是指调查者向被调查者询问,根据被询问者的答复来搜集资料的一种调查采访法是指调查者向被调查者询问,根据被询问者的答复来搜集资料的一种调查方法。包括:口头询问法;方法。包括:口头询问法;问卷法问卷法;开调查会;电话调查;开调查会;电话调查。问卷问卷是有问有答的调查表,提问方式和提问次序是问卷设计应注意的问题。问卷是有问有答的调查表,提问方式和提问次序是问卷设计应注意的问题。问卷的提问方式包括的提问方式包括封闭式提问和开放式提问封闭式提问和开放式提问两种方式,问卷的提问次序应遵循两种方式,问卷的提问次序
28、应遵循先易先易后难后难的原则。的原则。n(三)报告法(三)报告法调查单位向上报送统计资料的方法。如统计报表。调查单位向上报送统计资料的方法。如统计报表。48。六、统计调查误差六、统计调查误差n统计调查误差是统计调查所得到的数据与客观真实数据之间的偏差。统计调查误差是统计调查所得到的数据与客观真实数据之间的偏差。n根据误差产生的原因不同,对统计调查误差可进行如下分类:根据误差产生的原因不同,对统计调查误差可进行如下分类:登记性误差(计量、记录、计算等差错而引起的误差登记性误差(计量、记录、计算等差错而引起的误差)系统性误差系统性误差代表性误差代表性误差(样本代表性不足)随机性误差(抽样误差)(样
29、本代表性不足)随机性误差(抽样误差)统计调查误差统计调查误差49。第二节第二节 数据整理数据整理n一、什么是数据整理:数据资料的整理是指将统计调查所得到的原始资什么是数据整理:数据资料的整理是指将统计调查所得到的原始资料进行科学得分组和汇总,并用一定的方式将其显示出来,为统计分析料进行科学得分组和汇总,并用一定的方式将其显示出来,为统计分析推断提供系统化、条理化的资料的过程。推断提供系统化、条理化的资料的过程。n数据整理的步骤:数据整理的步骤:数据预处理、统计分组、汇总、显示。数据预处理、统计分组、汇总、显示。二、数据的预处理二、数据的预处理数据整理首先要对调查得到的数据进行审核,数据审核主要
30、从数据整理首先要对调查得到的数据进行审核,数据审核主要从完整性完整性和和准确性准确性两个方面进行。两个方面进行。完整性审核主要是检查应调查的单位或个体是完整性审核主要是检查应调查的单位或个体是否有遗漏,所有的调查项目或指标是否填写齐全等。准确性审核主要是否有遗漏,所有的调查项目或指标是否填写齐全等。准确性审核主要是检查数据资料是否真实地反映了客观实际情况,统计调查数据是否有错检查数据资料是否真实地反映了客观实际情况,统计调查数据是否有错误,计算是否正确等。误,计算是否正确等。数据审核的方法主要有数据审核的方法主要有逻辑检查逻辑检查和和计算检查计算检查两种方法。逻辑检查是定性两种方法。逻辑检查是
31、定性角度审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相角度审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象。计算检查是检查调查表中的各项数据在计算结果和计算互矛盾的现象。计算检查是检查调查表中的各项数据在计算结果和计算方法上有无错误。方法上有无错误。50。三、统计分组三、统计分组n(一)统计分组的概念和作用(一)统计分组的概念和作用统计分组统计分组是根据统计分析的目的和要求,按一定的标志将总体划分为若是根据统计分析的目的和要求,按一定的标志将总体划分为若个不同的部分个不同的部分。如人口按性别分为两组,学生按成绩分为五组。如人口按性别分为两组,学生按成绩分为五组
32、。统计分组的作用:统计分组的作用:(1)区分社会经济现象的类型。一个总体往往包含很多个体,通过)区分社会经济现象的类型。一个总体往往包含很多个体,通过统计分组可将性质相同的个体归为一类,从而把不同的社会经济统计分组可将性质相同的个体归为一类,从而把不同的社会经济现象区分开来。现象区分开来。(2)反映和研究总体的内部构成。通过统计分组后,计算各组成部)反映和研究总体的内部构成。通过统计分组后,计算各组成部分的总量占总体总量的比重,从而反映总体的内部构成状分的总量占总体总量的比重,从而反映总体的内部构成状(3)分析研究现象之间的依存关系。如将居民按收入分组,并计算)分析研究现象之间的依存关系。如将
33、居民按收入分组,并计算各组的消费支出,可看出收入与消费支出的依存关系。各组的消费支出,可看出收入与消费支出的依存关系。51。(二)统计分组的原则与类型(二)统计分组的原则与类型n1统计分组的原则统计分组的原则(1)完备性原则:总体中的任何一个个体都有组可归)完备性原则:总体中的任何一个个体都有组可归。(2)互斥性原则)互斥性原则:每个个体只能划归其中的一个组中。每个个体只能划归其中的一个组中。概括地讲进行统计分组时,要使总体中的每个个体都概括地讲进行统计分组时,要使总体中的每个个体都有组可归,而且只能归入其中一个组。即采取有组可归,而且只能归入其中一个组。即采取“不重不漏不重不漏”的原则。的原
34、则。n2、分组的类型、分组的类型 按分组标志的选择不同,统计分组可分为品质标志分组与数量标志分组两种按分组标志的选择不同,统计分组可分为品质标志分组与数量标志分组两种形式。形式。(1)品质标志分组的组数和组限比较容易划定。有多少个标志表现就可划)品质标志分组的组数和组限比较容易划定。有多少个标志表现就可划分为多少个组分为多少个组。对一些品质标志,其标志表现大众熟知,如性别、民族对一些品质标志,其标志表现大众熟知,如性别、民族等,相应的组数和组限很容易划定;而对于另一些品质标志如行业、职等,相应的组数和组限很容易划定;而对于另一些品质标志如行业、职业,可从国家统计局制定了统一的分类目录中查询,如
35、业,可从国家统计局制定了统一的分类目录中查询,如 国民经济行业国民经济行业分类目录分类目录、职业分类目录职业分类目录、产品分类目录产品分类目录等。等。不遗漏不重复52。(2)数量标志分组的组数和各组界限n按数量标志分组时,组数和各组界限都较复杂,需要人为地确定。按数量标志分组时,组数和各组界限都较复杂,需要人为地确定。数量标志分组有两种形式:数量标志分组有两种形式:n(1)单项式分组。单项式分组是每个组的组别只用一个变量值表示的)单项式分组。单项式分组是每个组的组别只用一个变量值表示的分组方式分组方式。即每遇到一个不同的变量值单独列组。即每遇到一个不同的变量值单独列组。n(2)组距式分组。组距
36、式分组是指每个组用表示一定变动范围的两个)组距式分组。组距式分组是指每个组用表示一定变动范围的两个变量值表示,即将数量标志的取值范围划分成若干个区间变量值表示,即将数量标志的取值范围划分成若干个区间。如职工按工。如职工按工资分组如下:资分组如下:800900,9001000,10001100,11001200。在组距式分组中,每组最大的变量值叫该组的上限,最小的变量值叫该在组距式分组中,每组最大的变量值叫该组的上限,最小的变量值叫该组下限,如上述工资分组中第一组的上限组下限,如上述工资分组中第一组的上限900,下限,下限800。组距上限下限组距上限下限 组距式分组又可分为等距分组与异距分组两种
37、。组距式分组又可分为等距分组与异距分组两种。53。统计分组品质标志分组数量标志分组单项式分组组距式分组等距分组异距分组54。3、分组体系、分组体系n对同一个总体采用两个或两个以上的分组标志进行一系列分组所对同一个总体采用两个或两个以上的分组标志进行一系列分组所形成的体系称为分组体系。分组体系可分为平行分组体系和复合形成的体系称为分组体系。分组体系可分为平行分组体系和复合分组体系两种类型。分组体系两种类型。n(1)平行分组体系。在同一个分组体系中,若将)平行分组体系。在同一个分组体系中,若将各个分组标志相互独立平行地进行分组,则这种分各个分组标志相互独立平行地进行分组,则这种分组体系称为平行分组
38、体系。如将工人总体按性别分,组体系称为平行分组体系。如将工人总体按性别分,按工龄分,按工种分按工龄分,按工种分。n(2)复合分组体系。在一个分组体系中,若将各)复合分组体系。在一个分组体系中,若将各个分组标志层叠或交叉进行分组,则这种分组体系个分组标志层叠或交叉进行分组,则这种分组体系称为复合分组体系。称为复合分组体系。各分组之间相互独立各分组之间不独立55。四、次数分布四、次数分布(一)次数分布的概念和类型(一)次数分布的概念和类型1、概念:、概念:按某种标志对总体进行分组后,就会形成总体单位数在各组之间的按某种标志对总体进行分组后,就会形成总体单位数在各组之间的分布,这就是次数分布。如某车
39、间工人按性别分组如下:分组后就必然分布,这就是次数分布。如某车间工人按性别分组如下:分组后就必然会形成会形成50个总体单位在各组间的分布,这就是个总体单位在各组间的分布,这就是次数分布次数分布。次数次数:分布在各组的总体单位数。:分布在各组的总体单位数。频率频率:各组次数与总次数之比。:各组次数与总次数之比。次数分布数列次数分布数列:将各组组别与次数:将各组组别与次数依次排列所形成的数列。依次排列所形成的数列。次数分布数列的要素:次数分布数列的要素:(1)组别组别(2)次数或频率次数或频率组别次数频率组别次数频率 按性别分按性别分人数人数比重比重男男300.6女女200.4合计合计50156。
40、2、次数分布数列的类型、次数分布数列的类型n按选择的分组标志的不同,次数分布数列可分为属性分布数列和变量分按选择的分组标志的不同,次数分布数列可分为属性分布数列和变量分布数列两种。布数列两种。n属性分布数列是按品质标志分组形成的数列,简称品质数列。如上述按属性分布数列是按品质标志分组形成的数列,简称品质数列。如上述按性别分组形成的分布数列。性别分组形成的分布数列。n变量分布数列是按数量标志分组形成的数列,简称变量数列。由变量分布数列是按数量标志分组形成的数列,简称变量数列。由于按数量标志分组有单项式分组与组距式分组之分,变量数列也于按数量标志分组有单项式分组与组距式分组之分,变量数列也有单项式
41、变量数列与组距式变量数列两种。单项式分组形成的数有单项式变量数列与组距式变量数列两种。单项式分组形成的数列叫单项式变量数列;组距式分组形成的数列叫组距式变量数列,列叫单项式变量数列;组距式分组形成的数列叫组距式变量数列,组距式变量数列根据组距的不同又可分为等距数列和异距数列。组距式变量数列根据组距的不同又可分为等距数列和异距数列。57。次数分布数列属性分布数列变量分布数列单项式数列组距式数列等距数列不等距数列58。家庭人口数家庭人口数户数户数比重比重1252102532562.5437.5合计合计40100按工资分按工资分人数人数比重比重8009002018.190010003027.4100
42、011004036.4110012002018.1合计合计110100 单项式数列等距数列按日产量分(件)按日产量分(件)人数人数比重比重7080820801001845100110123011012025合计合计40100异距数列59。n对于单项式数列和等距式数列可以通过比较各组次数或频率的大对于单项式数列和等距式数列可以通过比较各组次数或频率的大小,判断次数分布的疏与密的程度,次数或频率大的组,分布就小,判断次数分布的疏与密的程度,次数或频率大的组,分布就密集,次数或频率小的组,分布相对稀疏。密集,次数或频率小的组,分布相对稀疏。n对于异距数列,由于各组的组距不完全相等,各组次数或频率的对
43、于异距数列,由于各组的组距不完全相等,各组次数或频率的大小会受组距的影响,因此不能根据各组次数或频率的大小来判大小会受组距的影响,因此不能根据各组次数或频率的大小来判断分布的疏与密,为消除各组组距的影响,在分析异距数列时断分布的疏与密,为消除各组组距的影响,在分析异距数列时,需计算次数密度或频率密度,次数密度或频率密度大的组,分布需计算次数密度或频率密度,次数密度或频率密度大的组,分布就密集。次数密度和频率密度的计算公式如下:就密集。次数密度和频率密度的计算公式如下:n次数密度次数次数密度次数/组距;频率密度频率组距;频率密度频率/组距组距60。(二)次数分布数列的编制(二)次数分布数列的编制
44、n等距式数列的编制的步骤:等距式数列的编制的步骤:1、确定组数。、确定组数。对于等距式分组,在实际应用时,一般按斯特格斯对于等距式分组,在实际应用时,一般按斯特格斯(H.A.Sturges)提出的经验公式确定组数)提出的经验公式确定组数K:2、确定各组的组距。、确定各组的组距。全距最大变量值最小变量值全距最大变量值最小变量值 一般情况下一般情况下d取取5或或10的倍数的倍数 210N10loglog1K为组数,N为总体单位数KRd d为组距,R为全距61。3、组限的确定和组中值的计算、组限的确定和组中值的计算 n1、若分组变量为连续型变量,相邻两个组的组限应采用重叠的变量值,、若分组变量为连续
45、型变量,相邻两个组的组限应采用重叠的变量值,同时为遵循互斥性原则,在按组归类整理时,遵循同时为遵循互斥性原则,在按组归类整理时,遵循“上限不在内原则上限不在内原则”。n2、若分组变量为离散型变量,相邻两组的组限可以重叠也可以不重叠,、若分组变量为离散型变量,相邻两组的组限可以重叠也可以不重叠,若重叠仍然采用若重叠仍然采用“上限不在内上限不在内”的原则进行归类整理。的原则进行归类整理。n3、区分事物质的差别的数量界限应作为组限。、区分事物质的差别的数量界限应作为组限。n4、首末组的组限可以略大于最大变量值或略小于最小变量值。、首末组的组限可以略大于最大变量值或略小于最小变量值。n5、组中值:组中
46、值是组距式分组中各组变量值的代表值,用来代表各、组中值:组中值是组距式分组中各组变量值的代表值,用来代表各组变量值的一般水平,所以每组上限与下限的中点数值称为该组的组中组变量值的一般水平,所以每组上限与下限的中点数值称为该组的组中值。值。用组中值作为各组变量值一般水平的代表值,有一个必要的假定条件,用组中值作为各组变量值一般水平的代表值,有一个必要的假定条件,即各组数据在本组内呈均匀分布或对称分布。即各组数据在本组内呈均匀分布或对称分布。对于开口组,通常假定开口组的组距与邻组组距相等,然后求得组中对于开口组,通常假定开口组的组距与邻组组距相等,然后求得组中值。值。2下限上限组中值62。4、各组
47、次数或频率的计算、各组次数或频率的计算 n汇总各组次数与频率,将各组组别与各组次数一一对应排列,就得汇总各组次数与频率,将各组组别与各组次数一一对应排列,就得到所需的分布数列到所需的分布数列。n有时为了统计分析的需要,还需计算累计次数和累计频率。根据累有时为了统计分析的需要,还需计算累计次数和累计频率。根据累计的方向不同可分为向上累计和向下累计。计的方向不同可分为向上累计和向下累计。n向上累计:从变量值小的组向变量值大的组累加。向上累计:从变量值小的组向变量值大的组累加。n向下累计:从变量值大的组向变量值小的组累加。向下累计:从变量值大的组向变量值小的组累加。按日产量(件)按日产量(件)工人数
48、工人数向上累计次数向上累计次数向下累计次数向下累计次数70803030130809050801009010040120501001101013010合计合计13063。第三节数据资料的显示第三节数据资料的显示n一、统计表一、统计表统计表是用于显示统计数据的表格。其构成包括:总标题、统计表是用于显示统计数据的表格。其构成包括:总标题、横行标题、纵栏标题、数据资料、表末附注。横行标题、纵栏标题、数据资料、表末附注。n二、统计图二、统计图1、直方图、直方图2、折线图、折线图3、曲线图、曲线图4、茎叶图、茎叶图64。第三章第三章 数据分布特征的描述数据分布特征的描述l总量指标和相对指标总量指标和相对指
49、标l 集中趋势测度集中趋势测度l离散趋势的测度离散趋势的测度l偏态和峰度的测定偏态和峰度的测定65。第一节总量指标和相对指标第一节总量指标和相对指标n一、总量指标一、总量指标n(一)概念:总量指标是反映总体总规模或总水平的指标,例如国内生(一)概念:总量指标是反映总体总规模或总水平的指标,例如国内生产总值、全国人口数、粮食总产量、工业总产值等指标都是总量指标。产总值、全国人口数、粮食总产量、工业总产值等指标都是总量指标。n(二)种类:(二)种类:1、按反映总体内容的不同,可分为标志总量和总体单位总量。、按反映总体内容的不同,可分为标志总量和总体单位总量。标志总量是标志值之和;总体单位总量是总体
50、单位的总个数。标志总量是标志值之和;总体单位总量是总体单位的总个数。2、按其反映的时间状况的不同,总量指标可分为时点指标和时期指标。、按其反映的时间状况的不同,总量指标可分为时点指标和时期指标。时点指标,也称存量指标,它反映总体在某一瞬间的现存总量。时点指标,也称存量指标,它反映总体在某一瞬间的现存总量。时期指标也叫流量指标,它是反映总体在一段时期内的累计总量。时期指标也叫流量指标,它是反映总体在一段时期内的累计总量。相加后无意义相加后无意义一次性调查取得一次性调查取得与间隔长短无关与间隔长短无关与间隔长短有关与间隔长短有关经常性调查取得经常性调查取得可相加可相加66。3、按其表现形式不同,可