1、第一章 绪论第二章 统计调查与整理第三章 综合指标第五章 参数估计和假设检验第六章 相关与回归第七章 非参数检验第八章 时间序列第九章 指数结束结束一、统计学的产生与发展二、统计学的研究对象和研究方法三、统计学的要素和内容四、统计测定的层次主要内容主要内容目录目录(一)统计包含(一)统计包含三种涵义,两重关系三种涵义,两重关系1、统计工作:调查研究。资料收集、整理和分析。2、统计资料:工作成果。包括统计数据和分析报告。3、统计学:研究如何搜集、整理、分析数据资料的一 门方法论方法论科学。统计工作统计工作统计资料统计资料统统 计计 学学工作与工作成果关系工作与工作成果关系实践与理实践与理论关系论
2、关系统计学的性质:是一门适用于自然现象和社会现象的方法论学科。统计学的研究对象:大量现象的数量方面。包括数量 特征、数量关系、数量界限等。(二)统计学的研究对象(二)统计学的研究对象(三)统计学的研究对象(三)统计学的研究对象1、大量观察法是指对所研究的事物的全部或足够数量进行观察的方法。它可以使影响个体的偶然因素相互抵消,显示出现象的一般特征。其数理依据是反映随机现象基本规律的大数定律。2、综合指标法是从数量方面对现象总体特征的概括说明。综合指标法,就是运用各种综合指标对现象的数量特征、数量关系进行对比分析的方法。它是统计分析的基本方法。3、统计推断法是在一定置信程度(即可靠程度)下,根据样
3、本资料的特征对总体特征作出估计和预测的方法。统计推断是现代统计学的基本方法。产生产生原始社会后期:统计萌芽于计数活动;奴隶制国家产生:使统计日显重要;封建社会时期:统计已具规模;资本主义的兴起:统计扩展到社会经济各方面。统统 计学应运而生,统计学作为一门系统计学应运而生,统计学作为一门系统的科学,距今只有的科学,距今只有300多年的历史。多年的历史。发展(三个时期)发展(三个时期)(一)统计学的萌芽期(一)统计学的萌芽期(17世纪中世纪中18世纪中)世纪中)1、德国的记述学派(国势学派、德国的记述学派(国势学派 康令康令 (16061681)阿痕瓦尔(阿痕瓦尔(17191772;1764年首创
4、统计学一词)年首创统计学一词)他们在大学中开设他们在大学中开设“国势学国势学”采用记述性材料,采用记述性材料,讲述国家讲述国家“显著事项显著事项”,籍以说明管理国家的方法,籍以说明管理国家的方法。特点是特点是偏重于事物质的解释而忽视量的分析偏重于事物质的解释而忽视量的分析。(二)统计学的近代期(二)统计学的近代期(18世纪末世纪末19世纪末)世纪末)1、数理统计学派、数理统计学派 代表人物:法国的拉普拉斯,比利时的凯特勒代表人物:法国的拉普拉斯,比利时的凯特勒。拉普拉斯把拉普拉斯把古典概率论引进统计学古典概率论引进统计学,发展了概发展了概率论,推广了概率论在统计中的应用。率论,推广了概率论在统
5、计中的应用。2、政治算术学派、政治算术学派代表人物:英国的威廉代表人物:英国的威廉配第、约翰配第、约翰格朗特等。格朗特等。威廉威廉配第的代表著配第的代表著政治算术政治算术对当时的英、荷、对当时的英、荷、法等国的法等国的“国富和力量国富和力量”进行了数量的计算和比较;进行了数量的计算和比较;格朗特写出了第一本关于人口统计的著作格朗特写出了第一本关于人口统计的著作。他们开创他们开创了了从数量方面研究社会经济现象的先例从数量方面研究社会经济现象的先例。凯特勒把德国的国势学派、英国的政治算术学派和凯特勒把德国的国势学派、英国的政治算术学派和意大利、法国的古典概率论家以融合改造为近代意义的意大利、法国的
6、古典概率论家以融合改造为近代意义的统计学。他是数理统计学派的奠定人,有统计学。他是数理统计学派的奠定人,有“统计学之统计学之父父”之称。之称。2、社会统计学派、社会统计学派 代表人物:德国的克尼斯、恩格尔、梅尔等代表人物:德国的克尼斯、恩格尔、梅尔等。他们强调统计学是他们强调统计学是研究社会现象的科学研究社会现象的科学,包括统包括统 计资料的搜集、整理和分析研究,目的是要揭示现象计资料的搜集、整理和分析研究,目的是要揭示现象内部的联系内部的联系。(三)统计学的现代期(三)统计学的现代期(20世纪初至今)世纪初至今)统计学的主流从描述统计学统计学的主流从描述统计学转向转向推断统计学。推断统计学。
7、20世纪世纪30年代年代R费希尔的推断统计理论标志着现代数费希尔的推断统计理论标志着现代数理统计学的确立。理统计学的确立。60年代以后统计学发展有三个明显的趋势:年代以后统计学发展有三个明显的趋势:1统计学依赖和吸收数学更多;统计学依赖和吸收数学更多;2以统计学为基础的边缘学科不断形成;以统计学为基础的边缘学科不断形成;3与电子计算机技术相结合,应用范围更广,作用更大。与电子计算机技术相结合,应用范围更广,作用更大。1、统计总体和总体单位、统计总体和总体单位总体总体总体单位:组成总体的各个单位(或元素),是总体单位:组成总体的各个单位(或元素),是各项统计数字的原始承担者。各项统计数字的原始承
8、担者。同质性:总体中各个单位具有同质性:总体中各个单位具有某种共同的性质。某种共同的性质。大量性:总体总是包含大量的单位。大量性:总体总是包含大量的单位。(一)统计学的要素(一)统计学的要素特点特点2、标志、标志标志标志指标:综合反映总体数量特征的概念和数值。指标:综合反映总体数量特征的概念和数值。3、指标和指标体系、指标和指标体系分类:数量指标;质量指标分类:数量指标;质量指标标志与指标的联系与区别:标志与指标的联系与区别:联系(联系(1)一些数量标志汇总可以得到指标的数值)一些数量标志汇总可以得到指标的数值。区别(区别(1)标志是说明总体单位特征的,而指标是说统)标志是说明总体单位特征的,
9、而指标是说统 统计总体数量特征的;统计总体数量特征的;(2)数量标志与指标之间存在变换)数量标志与指标之间存在变换 关系。关系。(2)标志的具体表现,有的用数值有的用文字表示,)标志的具体表现,有的用数值有的用文字表示,而指标都是用数值表示的。而指标都是用数值表示的。4、变量和变量值、变量和变量值变量变量变量值:即变量的具体数值,包括标志值和指标数值变量值:即变量的具体数值,包括标志值和指标数值5、样本、样本必须取自所要研究的总体;必须取自所要研究的总体;从一个总体中可抽取许多个样本,这从一个总体中可抽取许多个样本,这些样本的数值是不同的,也即存在着些样本的数值是不同的,也即存在着随机的差异;
10、随机的差异;样本必须具有代表性;样本必须具有代表性;样本必须具有客观性,也即排除主样本必须具有客观性,也即排除主观因素的影响观因素的影响6、推断:就是以样本信息为依据对总体的某些特、推断:就是以样本信息为依据对总体的某些特 征作出预测和估计。征作出预测和估计。7、推断的可靠性:根据随机抽取的样本对总体推、推断的可靠性:根据随机抽取的样本对总体推断所得出的结果的可靠程度,也称断所得出的结果的可靠程度,也称置信度置信度。(二)统计学的内容(二)统计学的内容1、描述统计、描述统计指搜集、整理、分析并提供统计资指搜集、整理、分析并提供统计资料的理论和方法。料的理论和方法。主要任务:使反映客观事物的统计
11、数主要任务:使反映客观事物的统计数据可以一目了然,条理清晰,使用方据可以一目了然,条理清晰,使用方便,可以说明现象的数量特征和数量便,可以说明现象的数量特征和数量关系。关系。2、推断统计、推断统计是只依据样本资料推断总体特征的是只依据样本资料推断总体特征的技术和方法,包括参数估计和假设技术和方法,包括参数估计和假设检验的方法。检验的方法。描述统计是推断统计的前提,描述统计是推断统计的前提,推断统计是描述统计的发展。推断统计是描述统计的发展。统计测定(统计测定(measurement)即对总体数量特征的量度,包括登记、分类、即对总体数量特征的量度,包括登记、分类、标示、计算等。标示、计算等。四个
12、测定层次的比较四个测定层次的比较12341234测定层次测定层次特征特征运算功能运算功能举例举例1、定名测定、定名测定2、序列测定、序列测定3、间距测定、间距测定4、比率测定、比率测定分类分类分类;排序分类;排序分类;排序;分类;排序;有基本测量单位有基本测量单位分类;排序;分类;排序;有基本测量单位;有基本测量单位;有绝对零点有绝对零点计数计数计数;排序计数;排序计数;排序;计数;排序;加减加减计数;排序;计数;排序;加减加减乘除乘除产业分类产业分类企业等级企业等级产品质量产品质量差异差异商品销售商品销售额额有组织、有组织、有计划地有计划地搜集资料。搜集资料。要求:准确、要求:准确、完整、及
13、时完整、及时对调查资料对调查资料去伪存真、去伪存真、去粗取精、去粗取精、科学分类、科学分类、浓缩简化浓缩简化描述性分析描述性分析推断分析、推断分析、决策分析。决策分析。要求:定性要求:定性定量结合定量结合一、调查组织方式一、调查组织方式统计调查统计调查二、调查方案设计二、调查方案设计报表制度报表制度普普 查查重点调查重点调查典型调查典型调查抽样调查抽样调查方案内容方案内容调查表、调查表、问卷设计问卷设计制度化的制度化的经常性调查经常性调查专门组织调专门组织调查查全面调查全面调查非全面调查非全面调查统计报表制度统计报表制度由政府部门组织,采用统一的表格,由政府部门组织,采用统一的表格,自自上而下
14、上而下布置,布置,自下而上自下而上报告。报告。任务:任务:搜集搜集国民经济和社会发展基本情况国民经济和社会发展基本情况的资的资料,为制订国民经济和社会发展计划和料,为制订国民经济和社会发展计划和检查计划执行情况服务。检查计划执行情况服务。优点:优点:精心周密设计、高度统一、规范。精心周密设计、高度统一、规范。回收率高,内容相对稳定,便于资料积回收率高,内容相对稳定,便于资料积累、对比。累、对比。层层上报、逐级汇总,可以满足各部门层层上报、逐级汇总,可以满足各部门需要。需要。特点:特点:普查普查特点:特点:工作量大工作量大,时间性强时间性强,需要大量人力和财力。,需要大量人力和财力。任务:任务:
15、搜集重要的搜集重要的国情国力和资源状况国情国力和资源状况的全面资的全面资料,为政府制定规划、方针政策提供依据。料,为政府制定规划、方针政策提供依据。方式:方式:建立专门机构,配备专门人员调查。建立专门机构,配备专门人员调查。利用基层单位原始记录和核算资料发表调查。利用基层单位原始记录和核算资料发表调查。原则:原则:规定统一的标准时点。规定统一的标准时点。规定统一的普查期限。规定统一的普查期限。规定调查的项目和指标。规定调查的项目和指标。重点调查重点调查特点:特点:在总体中选择在总体中选择个别或部分个别或部分重点单位重点单位进行调查进行调查。任务:任务:及时了解总体基本情况,为主管部门指导工及时
16、了解总体基本情况,为主管部门指导工作服务。作服务。方式:方式:一次性调查;专门设计和备配人员现场调查。一次性调查;专门设计和备配人员现场调查。重点单位重点单位指在总体中有举足轻重地位的单位,指在总体中有举足轻重地位的单位,其标志值在总体标志总量中占有绝大比重。其标志值在总体标志总量中占有绝大比重。经常性调查;同报表制度结合,用统计报表经常性调查;同报表制度结合,用统计报表调查。调查。典型调查典型调查特点:特点:在全面分析的基础上,有在全面分析的基础上,有意识地意识地选择代表性选择代表性的的典型单位典型单位进行现场调查。进行现场调查。任务:任务:为研究某种特殊的社会经济问题,搜集详细为研究某种特
17、殊的社会经济问题,搜集详细的第一手资料,借以认识事物的的第一手资料,借以认识事物的本质特征本质特征、因果关系因果关系、变化趋势变化趋势。为理论和政策性问题。为理论和政策性问题研究提供依据。研究提供依据。作用:作用:适宜于研究处于萌芽状态事物和倾向性问题;适宜于研究处于萌芽状态事物和倾向性问题;适宜于分析事物的类型,它们之间的差别和适宜于分析事物的类型,它们之间的差别和关系。关系。方法:方法:“解剖麻雀解剖麻雀;划类选典划类选典;抓两抓两头头”。抽样调查抽样调查特点:特点:1按按随机原则随机原则从总体中抽取样本;从总体中抽取样本;2以样本指标(统计量)为依据以样本指标(统计量)为依据推断总体参数
18、推断总体参数 或或检验总体的某种假设检验总体的某种假设;3抽样误差可以事先抽样误差可以事先计算计算并加以并加以控制控制。登记性误差登记性误差代表性误差代表性误差编编 差差随机误差随机误差抽样平均误差抽样平均误差实际误差实际误差统计推断中的抽样误差就是统计推断中的抽样误差就是抽样平均误差抽样平均误差。它是处。它是处于调查所固有的,是对抽样推断精确度的量度。于调查所固有的,是对抽样推断精确度的量度。抽样调查的组织方式:抽样调查的组织方式:1简单随机抽样(纯随机抽样)简单随机抽样(纯随机抽样)方法:将总体单位编成抽样框,而后用抽签或方法:将总体单位编成抽样框,而后用抽签或 随机数表抽取样本单位。随机
19、数表抽取样本单位。适用:总体规模不大;总体内部差异小适用:总体规模不大;总体内部差异小2类型抽样(分层抽样)类型抽样(分层抽样)方法:将总体全部单位分类,形成若干个类型方法:将总体全部单位分类,形成若干个类型组,后从各类型中分别抽取样本单位,合成样本。组,后从各类型中分别抽取样本单位,合成样本。总体总体N样本样本n等额等额等比例等比例最优最优kiiknnnnn121nNNni1nNNniiii2213等距抽样(机械抽样)等距抽样(机械抽样)方法:将总体单位按某一标志排序,而后按一方法:将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。定的间隔抽取样本单位。排序依据的标志:(排序依据的标志
20、:(1)无无关标志;(关标志;(2)有有关标志关标志(总体单位按某一标志排序)(总体单位按某一标志排序)4整群抽样整群抽样方法:方法:将总体全部单位分为许多个将总体全部单位分为许多个“群群”,然,然后随机抽取若干后随机抽取若干“群群”,对被抽中的各,对被抽中的各“群群”内的所有单位登记调查。内的所有单位登记调查。总体群数总体群数R=16 样本群数样本群数r=4 样本容量样本容量例:例:ABCDEFGHIJKLMNOPLHPDhlpdnnnnn例:例:在某省在某省100多万农户抽取多万农户抽取1000户调查农户生产户调查农户生产性投资情况。性投资情况。5多阶段抽样多阶段抽样第一阶段:从省内部县中
21、抽取第一阶段:从省内部县中抽取5个县个县第二阶段:从抽中的第二阶段:从抽中的5个县中各抽个县中各抽4个乡个乡 第三阶段:从抽中的第三阶段:从抽中的20个乡中各抽个乡中各抽5个村个村 第四阶段:从抽中的第四阶段:从抽中的100个村中各抽个村中各抽10户户样本样本n=10010=1000(户户)抽样方法抽样方法1放回抽样放回抽样:抽出样本单位登记后放回总:抽出样本单位登记后放回总体,再抽时总体不变体,再抽时总体不变2不放回抽样不放回抽样:抽出样本单位登记后不放回总:抽出样本单位登记后不放回总体,再抽时总体渐次减少体,再抽时总体渐次减少调查方案的主要内容调查方案的主要内容 1、确定调查、确定调查目的
22、目的2、确定调查、确定调查对象对象和和调查单位调查单位 3、拟订调查、拟订调查提纲提纲4、确定调查、确定调查时间时间 5、编制调查的、编制调查的组织计划组织计划调查表与问卷设计调查表与问卷设计调查表调查表单一表单一表一览表一览表例:例:工业企业统计报表工业企业统计报表 问卷结构:问卷结构:说明词说明词+主题词句主题词句+作业记录作业记录例:例:人口普查登记表人口普查登记表问卷问卷设计设计 基本要求:基本要求:主题明确,形式简明,主题明确,形式简明,文字通俗,容易理解,文字通俗,容易理解,便于回答。词句编排,便于回答。词句编排,层次分明,先易后难。层次分明,先易后难。问卷形式:问卷形式:开放式词
23、句开放式词句对选式词句对选式词句多项选择式词句多项选择式词句顺位式词句顺位式词句标度式词句标度式词句案例案例主要任务主要任务资料审核、分组、资料审核、分组、汇总、制表、制图等。汇总、制表、制图等。分组分组频数分布频数分布统计表统计表统计图统计图分组分组2533421划分现象类型划分现象类型作用:作用:例:按所有制性质划分,我国现有例:按所有制性质划分,我国现有8种经济类型:种经济类型:国有经济;集体经济;私营经济;个体经济国有经济;集体经济;私营经济;个体经济联营经济;股份制经济;外商投资经济;港联营经济;股份制经济;外商投资经济;港澳台投资经济澳台投资经济2研究总体结构研究总体结构例:上海市
24、按例:上海市按GDP计算的三次产业结构(计算的三次产业结构(%)1980年年1990年年 1996年年 1997年年 GDP100 100 100 100 第一产业第一产业3.2 4.32.5 2.3 第二产业第二产业75.7 63.854.5 52.2 第三产业第三产业21.1 31.943.0 45.53研究现象之间的依存关系研究现象之间的依存关系例:中国农民家庭按收入分组的恩格尔系数(例:中国农民家庭按收入分组的恩格尔系数(1984年)年)按收入分组(元)按收入分组(元)200 300 400 500 600 800 1000恩格尔系数(恩格尔系数(%)64.9 60.2 56.7 54
25、.4 50.5 49.9 43.6分组标志的选择与分组形式分组标志的选择与分组形式关键:服从研究任务需要,反映总体本质特征关键:服从研究任务需要,反映总体本质特征形式形式按分组标志性质分按分组标志性质分品质标志分组品质标志分组数量标志分组数量标志分组按分组标志个数分按分组标志个数分简单分组简单分组复合分组复合分组分组体系分组体系频数分布(分布数列)频数分布(分布数列)是一种重要的分组资料,反映总体单位在各组的是一种重要的分组资料,反映总体单位在各组的分布状态。分布状态。基本形式:基本形式:分组分组单位数单位数频率频率合计合计100频数分布频数分布频率分布频率分布分类分类品质数列品质数列变量数列
26、变量数列单项数列单项数列组距数列组距数列等距数列等距数列异距数列异距数列变量数列的编制变量数列的编制1计算极差计算极差2确定形式确定形式单项数列:离散型且取值不多。单项数列:离散型且取值不多。组距数列:离散型且取值多或连续型。组距数列:离散型且取值多或连续型。3组距数列:组距;组数;组距数列:组距;组数;4计算各组频数,频率,累计频数,累计频率等。计算各组频数,频率,累计频数,累计频率等。5组中值的计算:闭口组;开口组组中值的计算:闭口组;开口组统计表统计表构成构成总表题总表题横行标题:统计研究的对象。也称横行标题:统计研究的对象。也称主词主词。纵栏标题:说明主词的指标名。也称纵栏标题:说明主
27、词的指标名。也称宾词宾词。数字资料数字资料分类分类主词主词简单表简单表分组表分组表复合表复合表宾词宾词平行形式平行形式交叉形式交叉形式编制规则:编制规则:统计图统计图直方图直方图等距数列:(变量,频数)等距数列:(变量,频数)异距数列:异距数列:(变量,频数密度变量,频数密度)折线图折线图曲线图曲线图等距数列:(组中值,频数)等距数列:(组中值,频数)异距数列:(组中值,频数密度)异距数列:(组中值,频数密度)单项数列:(变量,频数)单项数列:(变量,频数)向上累计分布:(变量上限,累计频数)向上累计分布:(变量上限,累计频数)向下累计分布:(变量下限,累计频数)向下累计分布:(变量下限,累计
28、频数)变量的组数无限增多时,折线变量的组数无限增多时,折线便趋于一条光滑的曲线。便趋于一条光滑的曲线。某厂职工人数统计表某厂职工人数统计表按性别分组按性别分组男男 职职 工工女女 职职 工工合合 计计人数(人)人数(人)(频数)(频数)比率()比率()(频率)(频率)25311536868.7531.25100.00返回返回某厂职工家庭人口分组统计某厂职工家庭人口分组统计按家庭人口分组按家庭人口分组1合合 计计职工户数职工户数(频数)(频数)比率()比率()(频率)(频率)7返回返回23456381055431202.915.241.320.512.18.0255100一一、综合指标概述综合指
29、标概述二、总量指标(绝对数指标)二、总量指标(绝对数指标)三、相对数指标(相对数)三、相对数指标(相对数)四、平均数指标(平均数)四、平均数指标(平均数)五、标志变异指标五、标志变异指标主要内容主要内容案例案例综合指标概述综合指标概述统计指标统计指标统计指标是综合反映统计总体数量特统计指标是综合反映统计总体数量特征的概念和数值。征的概念和数值。指标名称指标名称指标数值指标数值反映总体某一方面的质反映总体某一方面的质的规定性的规定性,是对总体本质是对总体本质特征的一种概括。特征的一种概括。是总体量的规定性在是总体量的规定性在一定时间、地点、条一定时间、地点、条件下的具体表现。件下的具体表现。统计
30、指标统计指标重要特点:具体性;重要特点:具体性;综合性综合性描述指标描述指标评价指标评价指标监测指标监测指标分类分类数量指标数量指标质量指标质量指标绝对数指标绝对数指标相对数指标相对数指标平均数指标平均数指标指标体系指标体系具有内在联系的一系列指标所构成的具有内在联系的一系列指标所构成的整体,即称为指标体系。整体,即称为指标体系。分类分类社会指标体系社会指标体系经济指标体系经济指标体系科技指标体系科技指标体系基本统计指标体系基本统计指标体系是针对某项社是针对某项社会经济问题而会经济问题而制定的专项指制定的专项指标体系,如工标体系,如工业经济效益指业经济效益指标体系、价格标体系、价格指标体系等。
31、指标体系等。专题统计指标体系专题统计指标体系概念概念 总量指标是反映社会经济现象总量指标是反映社会经济现象总规模总规模、总水平总水平的的 总和总和指标。指标。(1)反映国情、国力和企事业单位人、财、物)反映国情、国力和企事业单位人、财、物的状况;的状况;(3)是计算相对指标和平均指标的基础。)是计算相对指标和平均指标的基础。(2)是国民经济宏观管理和企业经济核算的基)是国民经济宏观管理和企业经济核算的基础性指标,是实行目标管理的工具;础性指标,是实行目标管理的工具;作用作用分类分类 按反映总体的内容分按反映总体的内容分按反映的时间状态分按反映的时间状态分(1)社会总产品,)社会总产品,(2)增
32、加值,)增加值,(3)国内生产总值()国内生产总值(GDP)按计量单位分按计量单位分国民经济统计中几个重要的生产总量指标国民经济统计中几个重要的生产总量指标标志总量标志总量总体单位总数总体单位总数时期总量时期总量时点总量时点总量实物量实物量劳动量劳动量价值量价值量概念概念相对指标是两个有联系的指标对比的相对指标是两个有联系的指标对比的比值比值,反映,反映事物的数量特征和数量关系。事物的数量特征和数量关系。(1)反映总体内在的结构特征)反映总体内在的结构特征(3)反映事物发展变化的过程和趋势。)反映事物发展变化的过程和趋势。(2)用于不同对象的比较评价;)用于不同对象的比较评价;作用作用种类种类
33、计划完成相对数计划完成相对数结构相对数结构相对数比例相对数比例相对数比较相对数比较相对数强度相对数强度相对数动态相对数动态相对数不同时期不同时期比比 较较动动 态态相对数相对数强强 度度相对数相对数不同现象不同现象比较比较不同总体不同总体比较比较比比 较较相对数相对数同一总体中同一总体中部分与部分部分与部分比比 较较部分与总体部分与总体比比 较较实际与计划实际与计划比比 较较比比 例例相对数相对数结结 构构相对数相对数计划完成计划完成相对数相对数同一时期比较同一时期比较同类现象比较同类现象比较应用原则应用原则(1)正确选择对比的基数;)正确选择对比的基数;(2)必须注意统计的可比性;)必须注意
34、统计的可比性;(3)相对指标要与总量指标相结合。)相对指标要与总量指标相结合。概念概念平均指标反映同类现象的平均指标反映同类现象的一般水平一般水平,是总体内各,是总体内各单位参差不齐的标志值的单位参差不齐的标志值的代表值代表值,也是对变量分,也是对变量分布布集中趋势集中趋势的测定。的测定。数据集中区数据集中区变量变量xx常用的几种平均数常用的几种平均数概概 念念 计算计算 公公 式式 特特 点点优点:优点:容易理,容易理,便于计算便于计算 灵敏度高灵敏度高 稳定性好稳定性好 和和 缺点:缺点:易受极值易受极值影响影响 在偏斜分布和在偏斜分布和U形分布中,形分布中,不具有代表性不具有代表性1.算
35、术平均数算术平均数()标志总量标志总量与总体单与总体单位总数的位总数的比值比值nxxiiiiffxx简单:简单:加权:加权:0 xx最小2xxx常用的几种平均数常用的几种平均数概概 念念 计算计算 公公 式式 特特 点点优点:优点:灵敏度高灵敏度高在某种不能计算在某种不能计算的条件下,可以代的条件下,可以代替替 缺点:缺点:不易理解不易理解 易受极值影响易受极值影响 有有“0”值时不能值时不能计算计算 2.调和平均数调和平均数()标志值倒标志值倒数平均数数平均数的倒数的倒数简单:简单:加权:加权:HxiHxnx/1iXiiHmmx/常用的几种平均数常用的几种平均数概概 念念 计算计算 公公 式
36、式 特特 点点优点:灵敏度高优点:灵敏度高 受极值影响小受极值影响小于于 和和 适宜于各比率适宜于各比率之积为总比率的变之积为总比率的变量求平均量求平均缺点缺点:有有“0”或负或负值时不能计算值时不能计算 偶数项数列只偶数项数列只能用正根能用正根3.几何平均数几何平均数()几个变量几个变量值连乘积值连乘积的几次根的几次根简单:简单:加权:加权:GxniGxxififiGxx常用的几种平均数常用的几种平均数概概 念念 计算计算 公公 式式 特特 点点4.中位数中位数(Me)标志值由标志值由小到大顺小到大顺序排列中序排列中居中间位居中间位置的标志置的标志值位置平值位置平均数均数上限公式:上限公式:
37、下限公式:下限公式:ifSmfUMem1/2ifSmfLMem1/2优点:优点:容易容易理解,理解,不受极值不受极值影响影响适宜于开口适宜于开口组资料和些不组资料和些不能用数字测定能用数字测定的事物的事物缺点:缺点:灵敏灵敏度和计算功能度和计算功能差差 间断数间断数Me常用的几种平均数常用的几种平均数概概 念念 计算计算 公公 式式 特特 点点5.众数众数(Mo)分配数列分配数列中出现次中出现次数最多的数最多的标志值位标志值位置平均数置平均数上限公式:上限公式:下限公式:下限公式:优点:优点:容易容易理解,理解,不受极值不受极值影响影响 缺点:缺点:灵敏灵敏度和计算功能度和计算功能差差 稳定性
38、差稳定性差 具 有 不 唯具 有 不 唯一性一性idddUMo212idddLMo211要点解释要点解释权数(权数(Weighted),是分布数列中的频数或频率。),是分布数列中的频数或频率。对求平均数具有对求平均数具有权衡轻重权衡轻重的作用,是影响平均数变的作用,是影响平均数变动的两个因素之一(另一因素是变量值)。动的两个因素之一(另一因素是变量值)。权数权数例例(1)(2)(3)X456合计合计频数频数 频率频率(%)10201025.050.025.040100.0X456合计合计频数频数 频率频率(%)20402025.050.025.080100.0X456合计合计频数频数 频率频率
39、(%)20101050.025.025.080100.0 x=5 x=5 x=4.75 调和平均数与算术平均数的区别调和平均数与算术平均数的区别例例频率分布变了,均值也变。因此,严格地说,频率分布变了,均值也变。因此,严格地说,权数应指权数应指频率频率。凡是掌握被平均指标的分母资料时,用算术平均法。凡是掌握被平均指标的分母资料时,用算术平均法。凡是掌握被平均指标的分子资料时,用调和平均法。凡是掌握被平均指标的分子资料时,用调和平均法。平均指标平均指标分子:标志总量分子:标志总量分母:总体单位总数分母:总体单位总数几何平均等于对数的算术平均几何平均等于对数的算术平均例例 组矩数列求中位数组矩数列
40、求中位数是用插值法对中位数组分割的结果。是用插值法对中位数组分割的结果。例例组距数列求众数组距数列求众数是以频数之差计算的比例分割众数组组距的结果。是以频数之差计算的比例分割众数组组距的结果。例例价格(元)价格(元)3.32.52.0合计合计销售量(斤)销售量(斤)3451254350.245.233.3iiiffxx元492.2129.29算术平均算术平均求某种商品三种零售价格的平均价格求某种商品三种零售价格的平均价格调和平均调和平均100.21105.21103.311010101iiiHmxmx494.203.1230价格(元)价格(元)3.32.52.0合计合计销售额(元)销售额(元)
41、10101030返回返回例例 求求95%、93%、90%的几何平均数的几何平均数%64.9279515.0%90%93%9533Gx455.8943.7561.8912.83190.0log93.0log95.0log31logGx%71.92Gx(计算误差:(计算误差:0.0007)返回返回例例(书上例(书上例11的资料)的资料)返回返回分组:分组:500 800 1100 1400 1700 2000频数:频数:4090110105705035 d1=20 d2=5 众数组众数组8001100求比例:求比例:d1/(d1+d2)=20/(20+5)=0.8分割众数组的组距:分割众数组的组距
42、:0.8(1100-800)=240(元)(元)下限公式下限公式加下限,即加下限,即M0=800+240=1040(元)(元)下页下页返回返回500800 1100 1400 1700 200050100150f(人数)(人数)月收入:元月收入:元1040上页上页 d1 d2例例(书上例(书上例11的资料)的资料)返回返回求比例:求比例:250-240/(345-240)=0.095分割中位数组的组距:分割中位数组的组距:1400-1100)0.095=28.5下限公式下限公式加下限,即加下限,即Me=1100+28.5=1128.5(元)(元)下页下页标志值由小到大标志值由小到大分组:分组:
43、500 800 1100 1400 1700 20000Mox SK0MoMoMoxxx(对称分布对称分布)正偏态分布(右)正偏态分布(右)负偏态分布负偏态分布(左)左)2.偏度系数偏度系数 (m3三阶中心矩三阶中心矩)定义定义M=(X-A)k/n为变量为变量X关于关于A的的k阶矩阶矩。当当A=0,即以原点为中心,上式称为,即以原点为中心,上式称为“K阶原点矩阶原点矩”。K=1,2,3时,有:时,有:一阶原点矩一阶原点矩M1=(X-0)1/n=X/n二阶原点矩二阶原点矩M2=(X-0)2/n=X2/n三阶原点矩三阶原点矩M3=(X-0)3/n=X3/n 当当A=,即以,即以 为中心,上式称为为
44、中心,上式称为“K阶中心矩阶中心矩”。xx33mK=1,2,3时,有:时,有:0/)(11nXXmnXXm/)(22nXXm/)(33 所以,所以,m3可以测定偏度。为消除量纲,转变为系数可以测定偏度。为消除量纲,转变为系数,再除以,再除以3。33m偏度系数0正偏态正偏态33m计算标准分计算标准分即将原始分数即将原始分数X经过线性变换转变为标准分经过线性变换转变为标准分Z。反映各。反映各原始分的平均数为中心的相对位置。原始分的平均数为中心的相对位置。)(ZXXXXZiiXOx 任何原始分在总体中的位任何原始分在总体中的位置,用置,用Z倍的倍的来测定。来测定。计算抽样误差(以平均指标为例)计算抽
45、样误差(以平均指标为例)设:设:样本平均数ix样本平均数的平均数x总体平均数X)(Xxi实际抽样误差)()()(2为样本数简称抽样误差抽样平均误差nnXxix)()(2加权形式或ffXxix,Xx ffxxix2)(利用样本统计量对总体某些性质或数量利用样本统计量对总体某些性质或数量特征进行推断。特征进行推断。随机原则随机原则总体参数总体参数统计量统计量推断估计推断估计参数估计参数估计检验检验假设检验假设检验抽样分布抽样分布抽样分布抽样分布简单随机抽样和简单随机样本的性质简单随机抽样和简单随机样本的性质不放回不放回放放 回回放回放回不放不放 回回独立性和同一性独立性和同一性同一性同一性当当n/
46、N5%时,有限总时,有限总体不放回抽体不放回抽样等同于放样等同于放回抽样回抽样统计量与抽样分布统计量与抽样分布统计量:即统计量:即样本指标样本指标。样本均值样本均值样本成数样本成数样本方差样本方差如:如:nXXinnPi22)(11XXnSi抽样分布:抽样分布:某一统计量所有可能的样本的取值形成某一统计量所有可能的样本的取值形成的分布。的分布。性性 质质数字特征数字特征0P(Xi)1P(Xi)=1均值均值E(X)方差方差Ex-E(x)2样本均值的抽样分布(简称均值的分布)样本均值的抽样分布(简称均值的分布)抽样抽样 均值均值均值均值=Xi/NnxXi样本均值是样本的函数,样本均值是样本的函数,
47、故样本均值是一个故样本均值是一个统计量统计量,统计量是一个统计量是一个随机变量随机变量,它的概率分布称为样本均它的概率分布称为样本均值的抽样分布。值的抽样分布。抽抽 样样 方方 法法 均均 值值 方方 差差 标标 准差准差(1)从无)从无限总体抽限总体抽 样样和有限总体和有限总体放回抽样放回抽样(2)从有限)从有限总体不放回总体不放回抽样抽样xxE)(xxE)(nx22)1(22NnNnxnx1NnNnx即均值推断的抽样误差和,12NnNnnxx抽样误差抽样误差抽样误差抽样误差从正态总体中抽样得到的均值的分布也服从从正态总体中抽样得到的均值的分布也服从正态分布正态分布。从非正态总体中抽样得到的
48、均值的分布呢?从非正态总体中抽样得到的均值的分布呢?中心极限定理:无论总体为何种分布,只要样本中心极限定理:无论总体为何种分布,只要样本n足够大足够大(n30),均值(),均值()标准化为()标准化为(z)变量,必定服从标准正态)变量,必定服从标准正态分布,均值(分布,均值()则服从正态分布,即:)则服从正态分布,即:xx)1(,)/,(),1,0(/22NnNnNXnNXNnX或两个样本均值之差的抽样分布两个样本均值之差的抽样分布抽样抽样抽样抽样?21Axx21估计估计),(2111NX),(2222NX),()(2221212121nnNxx则(1)如:)如:(2如果两个总体都是非如果两个
49、总体都是非正态总体,只要正态总体,只要n1、n2足够足够大,根据中心极限定理,可大,根据中心极限定理,可知:知:),()(2221212121nnNxx)1()1(,()(2222221111212121NnNnNnNnNxx)1()1(,()(2222221111212121NnNnNnNnNxx样本成数(即比例)的抽样分布(简称成数的分布)样本成数(即比例)的抽样分布(简称成数的分布)抽样抽样 成数成数成数成数P=Ni/N 所有可能的样本的成数(所有可能的样本的成数()所形成的分)所形成的分布,称为样本成数的抽样分布。布,称为样本成数的抽样分布。nnPi/nPPP,21抽抽 样样 方方 法
50、法 均均 值值 方方 差差 标标 准差准差(1)从无)从无限总体抽限总体抽 样样和有限总体和有限总体放回抽样放回抽样(2)从有限)从有限总体不放回总体不放回抽样抽样PnnEPEi)/()(PnnEPEi)/()(nPqP/2)1(2NnNnPqPnPqP)1(NnNnPqP根据中心极限定理,只要样本足够大,根据中心极限定理,只要样本足够大,的分布就近的分布就近似正态分布。(似正态分布。(np和和nq大于大于5时)时)抽样误差抽样误差抽样误差抽样误差P两个样本成数之差的抽样分布两个样本成数之差的抽样分布抽样抽样抽样抽样估计估计 当当n1、n2都足够大时,样本成都足够大时,样本成数数 都近似服从正