1、考试题型 填空题 10分(每空1分)单选题 10分 多选题 10分(每题2分)判断题 10分 计算题 60分(综合指标、动态数列、统计指数、抽样调查和相关分析)总论部分统计学中的几个基本概念 一、统计总体和总体单位总总体体同质性:总体中各个单位具有某种共同质性:总体中各个单位具有某种共同的性质。同的性质。大量性:总体总是包含大量的单位。大量性:总体总是包含大量的单位。特点特点概念概念差异性:个体与个体之间的差异。差异性:个体与个体之间的差异。总论部分统计学中的几个基本概念二、标志与统计指标 1标志标志定义定义 n总体单位的属性、特征的名称。总体单位的属性、特征的名称。分类分类 (1)按表现形式
2、分类)按表现形式分类 品质标志品质标志只能用文字表示的属性只能用文字表示的属性 数量标志数量标志可用数值表示的特征可用数值表示的特征(2)按有无差异分类)按有无差异分类不变标志不变标志各单位具体表现相同各单位具体表现相同 可变标志可变标志各单位具体表现不同各单位具体表现不同总论部分统计学中的几个基本概念2.统计指标 1)概念:统计指标是说明总体数量特征)概念:统计指标是说明总体数量特征的概念及其数量表现的概念及其数量表现。统计指标的一般。统计指标的一般 构成构成=指标名指标名+指标数值(由标志值计算)指标数值(由标志值计算)2)统计指标的特点)统计指标的特点 (1)数量性数量性 (2)综合性综
3、合性 (3)具体性具体性 标志和指标的区别与联系 区别区别:第一,二者说明对象不同。(第一,二者说明对象不同。(总体单位与总体数总体单位与总体数量量)第二,二者在表现形式上不同(第二,二者在表现形式上不同(标志的具体表现,标志的具体表现,有的用数值有的用文字表示,而指标都是用数值表有的用数值有的用文字表示,而指标都是用数值表示的示的)。联系联系:第一,统计指标是建立在标志表现基础上的第一,统计指标是建立在标志表现基础上的 第二,统计指标与标志之间存在着相互变换的关系。第二,统计指标与标志之间存在着相互变换的关系。三 变异与变量 1变异变异 统计中的标志和指标都是可变的,即标志和指标的统计中的标
4、志和指标都是可变的,即标志和指标的具体表现各不相同,它们之间的这种差别与变化称具体表现各不相同,它们之间的这种差别与变化称作变异。一种现象,不存在变异值。作变异。一种现象,不存在变异值。2变量变量 概念:概念:可以取不同数值的量,可变的数量标志和统可以取不同数值的量,可变的数量标志和统计指标都是变量计指标都是变量。有变量,也有变量值。有变量,也有变量值。变量按其数值是否连续可以分为离散变量和连变量按其数值是否连续可以分为离散变量和连续变量两种续变量两种 变量按性质不同,又可分为确定性的变量与随变量按性质不同,又可分为确定性的变量与随机变量。机变量。第二章调查组织方式调查组织方式统计调查统计调查
5、调查方案设计调查方案设计报表制度报表制度普普 查查重点调查重点调查典型调查典型调查抽样调查抽样调查方案内容方案内容调查表、调查表、问卷设计问卷设计制度化的制度化的经常性调查经常性调查专门组织调专门组织调查查全面调查全面调查 非全面调查非全面调查统计调查方案统计调查方案问卷调查方案 它是指导统计调查的纲领性文件纲领性文件,其主要 步骤:明确调查目的目的 确定调查对象(总体)对象(总体)、调查单位(总体单位)调查单位(总体单位)和填报单位填报单位(对立性单位)(对立性单位)拟定调查项目项目和制定调查表(单一和一览表)调查表(单一和一览表)确定调查时间、期限时间、期限和和地点地点 确定调查的形式形式
6、 调查工作的组织实施组织实施 统计整理的步骤 1、设计和编制统计整理方案。2、对调查资料进行审核。3、对调查资料进行分组、汇总、计算。4、对汇总后调查资料的审核。5、编制统计表。6、资料积累分组标志的选择与分组形式 应遵循以下原则:应遵循以下原则:1.根据统计研究目的研究目的与任务选择分组标志 2.选择最能反映现象本质现象本质的标志进行分组 3.根据现象所处历史条件和社会经济环境选择标志 关键:服从研究任务需要,反映总体本质特征关键:服从研究任务需要,反映总体本质特征形式形式按分组标志性质分按分组标志性质分品质标志分组品质标志分组数量标志分组数量标志分组按分组标志个数分按分组标志个数分简单分组
7、简单分组复合分组复合分组分组体系分组体系单项式单项式组距式组距式 变量数列的编制1计算极差计算极差2确定形式确定形式单项数列:离散型且取值不多。单项数列:离散型且取值不多。3组距数列:组距;组数;组限组距数列:组距;组数;组限4计算各组频数,频率,累计频数,累计频率等。计算各组频数,频率,累计频数,累计频率等。5组中值的计算:组中值的计算:闭口组;开口组闭口组;开口组 组距数列:离散型且取值多或连续型。组距数列:离散型且取值多或连续型。第三章总量指标总量指标 基本指标基本指标综合指标综合指标相对指标相对指标派生指标派生指标平均指标平均指标变异指标变异指标派生指标派生指标 按反映总体的内容分按反
8、映总体的内容分按反映的时间状态分按反映的时间状态分总体标志总量总体标志总量总体单位总数总体单位总数时期总量时期总量时点总量时点总量总量指标 不同时期不同时期比比 较较动动 态态相对数相对数强强 度度相对数相对数不同现象不同现象比较比较不同总体不同总体比较比较比比 较较相对数相对数同一总体中同一总体中部分与部分部分与部分比比 较较部分与总体部分与总体比比 较较实际与计划实际与计划比比 较较比比 例例相对数相对数结结 构构相对数相对数计划完成计划完成相对数相对数同一时期比较同一时期比较同类现象比较同类现象比较算术平均数概概 念念 计算计算 公公 式式 特特 点点优点:容易理解优点:容易理解 便于计
9、算便于计算 灵敏度高灵敏度高 稳定性好稳定性好 和和 缺点:易受极值缺点:易受极值影响影响 在偏斜分在偏斜分布和布和U U形分布中,形分布中,不具有代表性不具有代表性1.1.算术平均数算术平均数()标志总量标志总量与总体单与总体单位总数的位总数的比值比值简单:简单:加权:加权:xnxxi=iiiffxx=()最小=-2xx()0=-xx注意:注意:平均指标的分子与分母平均指标的分子与分母总体和范围相同总体和范围相同调和平均数概概 念念 计算计算 公公 式式 特特 点点优点:灵敏度高优点:灵敏度高在某种不能计算在某种不能计算的条件下,可以代的条件下,可以代替替 缺点:不易理解缺点:不易理解 易受
10、极值影响易受极值影响 有有“0”值时不值时不能计算能计算 2.调和平均数调和平均数()标志值倒标志值倒数平均数数平均数的倒数的倒数简单:简单:加权:加权:HxiHxnx/1S=iXiiHmmx/SS=可理解为已知多个平均数或相可理解为已知多个平均数或相对数,再求它们的平均数。对数,再求它们的平均数。几何平均数概概 念念 计算计算 公公 式式 特特 点点优点:灵敏度高优点:灵敏度高 受极值影响小受极值影响小于于 和和 适宜于各比率适宜于各比率之积为总比率的变之积为总比率的变量求平均量求平均缺点缺点:有有“0”或或负值时不能计算负值时不能计算 偶数项数列只偶数项数列只能用正根能用正根3.几何平均数
11、几何平均数()几个变量几个变量值连乘积值连乘积的几次根的几次根简单:简单:加权:加权:GxniGxxp=ififiGxxS=p一般适用于各变量值之间存在一般适用于各变量值之间存在环比关系的事物。如:银行平环比关系的事物。如:银行平均利率、各年平均发展速度。均利率、各年平均发展速度。中位数概概 念念 计算计算 公公 式式 特特 点点4.中位数中位数(Me)标志值由标志值由小到大顺小到大顺序排列中序排列中居中间位居中间位置的标志置的标志值位置平值位置平均数均数上限公式:上限公式:下限公式:下限公式:优点:容易优点:容易理解,理解,不受极值不受极值影响影响适宜于开口适宜于开口组资料和些不组资料和些不
12、能用数字测定能用数字测定的事物的事物缺点:灵敏缺点:灵敏度和计算功能度和计算功能差差 间断数间断数MeifSmfUMem+-S-=1/2ifSmfLMem-S+=1/2S Sm m1-1-中位数所在组以下的中位数所在组以下的累计次数。累计次数。S Sm+1-m+1-中位数所在组以上的中位数所在组以上的累计次数。累计次数。众数概概 念念 计算计算 公公 式式 特特 点点5.众数众数(Mo)分配数列分配数列中出现次中出现次数最多的数最多的标志值位标志值位置平均数置平均数上限公式:上限公式:下限公式:下限公式:优点:优点:容易理解,容易理解,不受极值影不受极值影响响 缺点:缺点:灵敏度和计灵敏度和计
13、算功能差算功能差稳定性差稳定性差具有不唯一具有不唯一性性idddUMo+-=212idddLMo+=211d d1 1-众数所在组与前一组频数的差。众数所在组与前一组频数的差。d2-众数所在组与下一组频数的差众数所在组与下一组频数的差。调查250名教师的工资收入,得资料如下:按工资收入分组(元)人 数500以下500-600600-800800-10001000-15001500-20002000以上10253045705515合 计250计算这250名教师工资收入的平均数、众数、中位数和标准差。典型例题第四章动态数列动态数列平均指标数列平均指标数列总量指标数列总量指标数列相对指标数列相对指标
14、数列时点数列时点数列时期数列时期数列动态动态数列数列动态动态分析分析指标指标分析现象变动分析现象变动水平指标水平指标分析现象变动分析现象变动速度指标速度指标发展水平发展水平 平均发展水平平均发展水平增长量增长量 平均增长量平均增长量增长速度增长速度 平均增长速度平均增长速度发展速度发展速度 平均发展速度平均发展速度naaS=时期数列S+S=-+=SS=S=+ffaaanaaaafafanaaiiin)(2112121121间隔不等的间隔相等的间断时点数列非连续变动的连续变动的连续时点数列时点数列间隔相等的间隔相等的间隔不等的间隔不等的baY=发展速度 观察期内各环比发展速度的连乘积等于最末期的
15、定基发展速度 两个相邻的定基发展速度,用后者除以前者,等于相应的环比发展速度=-为连乘符号01YYYYnii1010-=iiiiYYYYYY发展速度和增长速度1.环比增长速度=环比发展速度12.定基增长速度=环比发挥速度13.环比增长速度和定基增长速度之间不存在环比增长速度和定基增长速度之间不存在 直接的换算关系。直接的换算关系。1-=-=发展速度基期水平基期水平报告期水平基期水平增长量增长速度平均发展速度和平均增长速度 平均发展速度-1=平均增长速度 几何法(水平法)和方程法(累计法)重点掌握几何法,理解方程法。11201210nnnnnnnXaaaaaaaaaa-=2110ninniaXX
16、XXa-=+=第五章平均数指数平均数指数0000.pqpqkqpkpqpq1111=0001pqpqKq=1011qpqpKp综合指数综合指数数量指标指数数量指标指数质量指标指数质量指标指数=qK=pK同度量因素的选择原则 编制质量指标综合指数,同度量因素必编制质量指标综合指数,同度量因素必须选择数量指标须选择数量指标 编制数量指标综合指数,同度量因素必编制数量指标综合指数,同度量因素必须选择质量指标须选择质量指标 同度量因素时期的选择同度量因素时期的选择 质量指标综合指数质量指标综合指数应以应以报告期数量指标报告期数量指标为为同度量因素;同度量因素;而而数量指标综合指数数量指标综合指数应以应
17、以基期质量指标基期质量指标作作为同度量因素。为同度量因素。平均指标对比指数 只是因素分析法的一种应用01111111110000100010XX fX fX ffffXKX fX fX fXfff =可变构成指数可变构成指数结构影响指数结构影响指数固定构成指数固定构成指数假定x指数体系=011100010011pqpqpqpqpqpq)()(011100010011-+-=-pqpqpqpqpqpq绝对对数关系绝对对数关系相对数关系相对数关系 因素分析法是根据指数体系的理论,再分析受多种因素因素分析法是根据指数体系的理论,再分析受多种因素影响的事物变动时,为了观察某一因素变动的影响而将影响的事
18、物变动时,为了观察某一因素变动的影响而将其他因素固定下来,如此逐项分析,逐项替代,故称因其他因素固定下来,如此逐项分析,逐项替代,故称因素分析法素分析法 分类:分类:按包含因素的多少分:按包含因素的多少分:两因素分析和多因素分析两因素分析和多因素分析 按指标的划分分:按指标的划分分:总量指标因素分析和平均指标因素分总量指标因素分析和平均指标因素分析析 步骤:步骤:1 1、根据关系建立指数体系。、根据关系建立指数体系。2 2、计算分析指标的总变动程度的相对数和绝对数、计算分析指标的总变动程度的相对数和绝对数 3 3、计算影响因素的总变动程度的相对数和绝对数、计算影响因素的总变动程度的相对数和绝对
19、数 4 4、对等量关系进行综合说明、对等量关系进行综合说明指数体系基础上的因素分析价格指数销售量指数销售额指数=011100010011pqpqpqpqpqpqpqPL=pqKK=相对数分析相对数分析绝对数分析绝对数分析00pq变化q01pq变化p11pq)()()(qqpq单价销售量销售额=011100010011pqpqpqpqpqpq-+-=-)()(011100010011pqpqpqpqpqpq=0011qpqpKpq%51.1204728.568=-=-8.964728.5680011qpqp=0001pqpqKq%05.1184722.557=-=-2.854722.557000
20、1pqpq=1011qpqpKp%08.1022.5578.568=-=-6.112.5578.5681011qpqp=101100010011qpqppqpqqpqp%08.102%05.118%51.120=6.112.85)(8.96+=万元)()(101100010011-+-=-qpqppqpqqpqp例:相对分析中,销售额总体上报告期比基期上升了20.51%,其中由销售量增长18.05%,价格增长2.08%共同引致的。绝对分析中,销售额总体上增加了96.8万元,其中85.2万元的增量是由于销售量增大引起的,剩余的11.6万元的增量是由于价格提高引起的。第六章 重复抽样条件下重复抽样
21、条件下 在不重复抽样条件下在不重复抽样条件下 nnx=221xNnnN-=-不重复抽样的修正系数不重复抽样的修正系数当当N N 很大时,很大时,NnNnN-11当抽样比(当抽样比(n nN N)很小时,)很小时,11-Nn1.抽样平均误差(抽样误差抽样平均误差(抽样误差)2.抽样极限误差-xx +xXx3.概率度xxt=或或xxt=ppt=或或ppt=借助借助t和和 就可以计算极限误差就可以计算极限误差x区间估计 3 t9973.03x3x2 t9545.02x2x1 t6828.0 x x xx xxxxxxxx=+=+=+)()()(概率度)()(XPXPXPX 某进出口公司出口一种名茶,
22、为检查其每包规格的质某进出口公司出口一种名茶,为检查其每包规格的质量,现用重复抽样的方法抽取量,现用重复抽样的方法抽取100100包,检验结果如表包,检验结果如表3 3:表表3 3 某公司茶叶质量抽样表某公司茶叶质量抽样表每包重量(克)每包重量(克)包数包数1481481491491491491501501501501511511511511521521010202050502020合计合计100100按规定这批茶叶每包规格重量应不低于按规定这批茶叶每包规格重量应不低于150150克,试以克,试以99.73%99.73%的的概率推断这批茶叶每包平均重量所在的区间范围,并确定茶概率推断这批茶叶每
23、包平均重量所在的区间范围,并确定茶叶每包规格质量是否达到要求。叶每包规格质量是否达到要求。x表表10-4 10-4 某公司茶叶质量抽样误差计算表某公司茶叶质量抽样误差计算表每包重量每包重量(克)(克)1481481491491491491501501501501511511511511521521010202050502020148.5148.5149.5149.5150.5150.5151.5151.5148514852990299075257525303030301.81.80.80.80.20.21.21.232.432.412.812.82 228.828.8合计合计100100150
24、30150307676fxfxx-fxx2)(-包数包数组中值组中值3.15010015030=fxfx(克)(克)76.0100762=-=ffxxS(克)(克)087.010076.02=nx(克)(克)=xtx261.0087.03=(克)(克)261.03.150-X261.03.150+150.039150.039 X150.561 150.561 重复抽样:重复抽样:平均数的必要样本容量:平均数的必要样本容量:成数的必要样本容量:成数的必要样本容量:222xxtn=22)1(ppPPtn-=必要样本容量的确定 不重复抽样不重复抽样 平均数的必要样本容量:平均数的必要样本容量:成数的
25、必要样本容量:成数的必要样本容量:22222tNNtnxx+=)1()1(222PPtNPPNtnpp-+-=必要样本容量的确定 例例 对某油田的对某油田的2000口油井的年产油量进行抽样口油井的年产油量进行抽样调查。根据历史资料可知,油井年产油量的标准调查。根据历史资料可知,油井年产油量的标准差为差为200吨,若要求抽样误差不超过吨,若要求抽样误差不超过15吨,概率保吨,概率保证程度为证程度为95.45%,试求需要调查多少口油井,试求需要调查多少口油井 解:解:F(t)=95.45%t=2第七章相关系数简化公式相关系数简化公式 :-=2222)(.)(.yynxxnyxxynr-=fyyfx
26、xfyyxxr22(简单式)(简单式)(加权式)(加权式)简化公式简化公式 :-=2222)(.)(.yynxxnyxxynr-=fyyfxxfyyxxr22(简单式)(简单式)(加权式)(加权式)0r0.3,为微弱相关;,为微弱相关;0.3r0.5,为低度相关;,为低度相关;0.5r0.8,为显著相关;,为显著相关;0.8r1,为高度相关。,为高度相关。相关系数简捷法计算表相关系数简捷法计算表月份月份1 12 23 34 45 56 62.42.43.13.14.34.35.25.24.44.46.16.13232434351516161535378785.765.769.619.6118.
27、4918.4927.0427.0419.3619.3637.2137.2110241024184918492601260137213721280928096084608476.876.8133.3133.3219.3219.3317.2317.2233.2233.2475.8475.8合计合计25.525.5318318117.47117.4718088180881455.61455.6xy2x2yxy产量产量总成本总成本223181808865.2547.11763185.256.14556-=r=0.9826=0.9826 回归分析与相关分析的关系 联系联系 :二者都是对客观事物数量:二者
28、都是对客观事物数量依存关系的分析依存关系的分析。一方面,。一方面,相关分析是回归分析的相关分析是回归分析的基础和前提基础和前提。另一方面,回归分析是。另一方面,回归分析是相关分析的相关分析的深入和继续深入和继续。区别区别 :1 1)回归分析中变量之间的关系是不对等的)回归分析中变量之间的关系是不对等的 2 2)在两个变量互为因果的情况下,可以配合两个回归方程)在两个变量互为因果的情况下,可以配合两个回归方程 3 3)在回归分析中,确定回归方程时只要求因变量是随机变)在回归分析中,确定回归方程时只要求因变量是随机变量,而自变量为给定的值量,而自变量为给定的值 注意:回归分析中的经济定性分析很重要
29、,要根据知识、经注意:回归分析中的经济定性分析很重要,要根据知识、经验和常识来判断二者的因果关系,一般来说都比较明确。验和常识来判断二者的因果关系,一般来说都比较明确。简单直线回归方程的配合方法 回归方程式,其一般形式为:应用最小平方法原理有:bxayc+=+=xbnay+=2xbxaxy-=22)(xxnyxxynbxbynxbnya-=-=例题月份月份产量产量(千件)(千件)单位成本(元)单位成本(元)123456234345737271736968 某企业上半年产品产量与单位成本资料如下:要求:、计算相关系数,说明两个变量相关的密切程度。、配合回归方程,指出产量每增加1000件时单位成本
30、平均 变动多少?、假定产量为6000件时,单位成本为多少元?答案设产量为自变量(x),单位成本为因变量(y),列表计算如下:月份月份产量产量(千件)(千件)单位成本(元)单位成本(元)x2y2xy123456234345737271736968491691625532951845041532947614624146216284219276340合计2142679302681481-=2222)()(yynxxnyxxyn存在高度负相关说明产量和单位本之间9091.09091.042630268621796426211481622=-=-=第一步 计算相关系数,分析相关性第二步第二步 写出回归方程写出回归方程xybxyanxxnyxxybc82.137.77.37.7762182.1642682.15510621796426211481222-=-=-=-=-=-=-=回归方程为配合加归方程配合加归方程bxayc+=产量每增加1000件时,单位成本平均下降1.82元当产量为6000件时,即x=6,代入回归方程:77.37-1.826=66.45(元)即产量为6000件时,单位成本为66.45元.第三步第三步 根据要求进行分析根据要求进行分析cy=
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。