1、2022-5-231在终极的分析中,一切知识都是历史在抽象的意义下,一切都是科学数学在理性的基础上,所有的判断都是统计学 C.R.劳应用统计学2022-5-2321 统计学是什么统计学是什么uStatistics is the science of collecting, organizing, presenting, analyzing, and interpreting numerical data to assist in making more effective decisions.u统计学是关于下列活动的方法和程序: 采集数据,例如问卷调查 呈现数据,例如绘制图表 概括数据,例如计
2、算均值 分析数据,例如区间估计 做出决策,例如假设检验2022-5-233无处不在的统计无处不在的统计u在诺贝尔经济学获奖者中,2/3以上的研究成果与统计和定量分析有关。因此,著名经济学家萨缪尔森在其经典的教科书经济学12版中特别提到:“在许多与经济学有关的学科中,统计学是特别重要的”。u1981年,首届国际红楼梦研讨会在美国召开,威斯康星大学讲师陈炳藻独树一帜,宣读了题为从词汇上的统计论红楼梦作者的问题的论文。他从字、词出现频率入手,通过计算机进行统计、处理、分析,对红楼梦后40回系高鹗所作这一流行看法提出异议,认为120回均系曹雪芹所作。2022-5-234无处不在的统计无处不在的统计(续
3、)(续)u大仲马的作品多曲折感人,而他又多私生子。取笑讥讽他的人,往往把他的作品比作他的私生子。最使他头痛的是巴黎统计学会的秘书长李昂纳,这人是大仲马的朋友,每次举统计数字的例子,总是说大仲马的情妇和私生子有多少。有一年该统计学会开年会,大仲马估计,李昂纳又要大放厥词,说他的坏话了。于是他请求参加年会,获得了批准。果然不出大仲马所料,李昂纳又举他的情妇和私生子的例子。李昂纳报告完毕,请大仲马致词。一向不愿在大庭广众之下发表演讲的大仲马,这次却破例登台说: “所有统计数字都是撒谎的,包括有关本人的数字在内” 。听众哄堂大笑。 2022-5-235 统计的应用统计的应用u学者不能离开统计而研究u政
4、治家不能离开统计而施政u企业家不能离开统计而执业 - 马寅初2022-5-2362 如何学统计学如何学统计学uCultivate your statistical awareness in your daily life. numeric information on newspaper, TV program, websuRead some good books on statistics books magazinesuPractice statistical skills by exercises and computer software. Excel Spss Sas2022-5-2
5、373 教材及参考文献教材及参考文献u应用统计学,施金龙、吕洁,南京大学出版社,2005u统计学,贾俊平、何晓群、金勇进,中国人民大学出版社,2002u统计学概论,曾五一,首都经济贸易大学出版社,2003u统计学的世界,戴维S穆尔,中信出版社,2003uThe Basic Practice of Statistics,David S. Moore ,W. H. Freeman Company出版社,20042022-5-2384 课程成绩评定课程成绩评定u期末书面考试成绩(70%)u平时各项表现成绩(30%) 课堂参与(10%) 作业完成(20%)2022-5-2395 课程主要内容课程主要内
6、容 第一章 绪论 第二章 统计调查 第三章 统计整理 第四章 综合指标 第五章 变异与均衡指标 第六章 时间数列2022-5-2310 课程主要内容课程主要内容(续)(续) 第七章 指数 第八章 抽样分布 第九章 参数估计 第十章 假设检验 第十一章 方差分析 第十二章 相关分析2022-5-2311第一章第一章 绪论绪论u一、统计涵义u二、统计工作u三、统计资料u四、统计科学那些默默无闻的统计学家们已经改变了我们的世界,不是由发现新的事实或技术,而是改变了我们推理和试验的方法,以及我们对这个世界的观念的形成方式。 哈克英2022-5-2312一、统计涵义一、统计涵义Statistics: (
7、1)Numeric data, when used as plural of statistic.(2)A scientific procedure used in the study and evaluation of numeric data.统计:(1)统计工作(2)统计资料(3)统计科学2022-5-2313二、统计工作二、统计工作工作任务:调查、分析,服务、监督工作职能:信息,咨询,监督工作过程:设计,调查,整理,分析工作组织:集中、分散,综合、专业2022-5-2314三、统计资料三、统计资料u数据计量:定类、定序,定距、定比。u定类尺度是按照客观现象的某种属性对其进行分类。例如,
8、人口按性别分为男女,用“1” 表示男性,用“0” 表示女性。定类尺度的主要数学特征是“=”或“”。u定序尺度是对客观现象各类之间的等级差或顺序差的一种测度。例如,学生成绩可以分为优、良、中、及格和不及格等五类。定序尺度的主要数学特征是“”。2022-5-2315数据计量数据计量u定距尺度是对现象类别或次序之间间距的测度。定距尺度不但可以用数表示现象各类别的不同和顺序大小的差异,而且可以用确切的数值反映现象之间在量方面的差异。定距尺度使用的计量单位一般为实物单位(自然或物理)或者价值单位。定距尺度的主要数学特征是“+”或“”。统计中的总量指标就是运用定距尺度计量的。u定比尺度是在定距尺度的基础上
9、,确定相应的比较基数,然后将两种相关的数加以对比而形成相对数(或平均数),用于反映现象的结构、比重、速度、密度等数量关系。例如,将一个企业创造的增加值与该企业的职工人数对比,计算全员劳动生产率,以此反映该企业的生产效率。定比尺度的主要数学特征是“”或“”。2022-5-2316数据类型数据类型uQuantitative (or measurement) data uQualitative (or categorical) datauDiscrete data ,Continuous datau横截面数据又称为静态数据,它是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。时间序列数据
10、又称为动态数据,它是指在不同时间对同一总体的数量表现进行观察而获得的数据。 数据信息知识智慧2022-5-2317四、统计科学四、统计科学u1 统计学发展简史u2 统计学对象方法u3 统计学基本概念2022-5-23181 统计学发展简史统计学发展简史英国(1690),威廉配第,政治算术德国(1749),阿亨瓦尔,国势学比利时(19世纪中),凯特勒,数理统计德国(19世纪中),恩格尔,社会统计2022-5-2319理论统计学和应用统计学理论统计学和应用统计学u历经300多年的发展,统计学目前已经成为横跨社会科学和自然科学领域的多科性的科学。 u统计学是有关如何测定、收集和分析反映客观现象总体数
11、量的数据,以便给出正确认识的方法论科学。u从横向看,各种统计学都具有上述共同点,因而能够形成一个学科“家族”。从纵向看,统计学方法应用于各种实质性科学,同它们相结合,产生了一系列专门领域的统计学。u现代统计学可以分为两大类:一类是以抽象的数量为研究对象,研究一般的收集数据、整理数据和分析数据方法的理论统计学;另一类是以各个不同领域的具体数量为研究对象的应用统计学。2022-5-2320统计学学科体统计学学科体系系 经经济济学学社社会会学学教教育育学学其其他他社社科科物物理理学学生生物物学学医医学学其其他他理理工工农农经经济济统统计计社社会会统统计计教教育育统统计计其其他他社社科科统统计计统统计
12、计学学物物理理统统计计生生物物统统计计医医药药统统计计其其他他理理工工农农统统计计统计学家未必是经济学家,统计学家未必是经济学家,经济学家也未必是统计学家。经济学家也未必是统计学家。但经济统计学家应当但经济统计学家应当-既是统计学家又是经济学家。既是统计学家又是经济学家。2022-5-23212 统计学对象方法统计学对象方法对象:实质性学科与方法论学科 理论统计学与应用统计学方法:特殊方法论与通用方法论 描述统计学与推断统计学 大量观察,平均分析,归纳推断2022-5-2322统计学家与数学家的对话统计学家与数学家的对话u一名统计学家遇到一位数学家,统计学家调侃数学家,说道:“你们不是说若且,
13、则吗,那么想必你若是喜欢一个女孩, 那个女孩喜欢的男生你也会喜欢了?”u数学家想了一下,反问道:“如果你把左手放到一锅一百度的开水中,右手放到一锅零度的冰水里, 想来你也没事吧!因为它们平均不过是五十度而已! ”2022-5-2323Descriptive and Inferential Statisticsu描述统计:研究如何取得反映客观现象的数据,并通过图表形式对所搜集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。 u推断统计:研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行表书的基础上,对统计总体的未知数量特征做出以概率形式表述的推
14、断。 2022-5-23243 统计学基本概念统计学基本概念u总体、个体、样本u标志、指标、变量u同质、变异、分布u统计量、参数 同质性是总体的前提 变异性是统计的前提。样本总体2022-5-2325第二章第二章 统计调查统计调查u一、统计调查概述 u二、统计调查方案u三、统计调查体系数据胜过自封的专家。 戴维穆尔2022-5-2326一、统计调查概述一、统计调查概述u调查概念:直接搜集资料u调查要求:准确、及时、系统、方便u调查用意:为研究提供素材 对表现进行衡量 用数据阐明问题2022-5-2327Data Sources数据数据来源来源直接来源直接来源间接来源间接来源试验试验出版物出版物
15、(或者网上或者网上)问卷问卷观察观察2022-5-2328调查方法调查方法u观察法: 现场,直接u询问法: 采访,问卷,通讯,网上u报告法: 行政,向上u实验法: 随机,双盲,重复2022-5-2329二、统计调查方案二、统计调查方案u目的、任务: 为什么调查u对象、单位: 向谁调查u项目、表格: 调查什么u时间、期限: 什么时候调查 什么时候的资料2022-5-2330Questionnaire Designu问题内容u问题措辞u问题次序u答问方式u版面设计 2022-5-2331 普 查全面报表抽样调查重点调查典型调查周期性调查一次性调查普 查抽样调查重点调查典型调查全面调查非全面调查连续
16、(经常性)调查不连续调查定期报表专门调查调 查范 围调 查时 间组 织形 式统计调查种类统计调查种类2022-5-2332三、统计调查体系三、统计调查体系u统计报表: 定报,年报u普 查: 一次,专门u抽样调查: 随机,推断u重点调查: 重点,大体u典型调查: 典型,细致2022-5-2333统计调查体系改革统计调查体系改革u我国长期以来,基本上依靠全面统计报表采集统计资料。改革开放后,抽样调查等非全面调查虽然有所发展,但应用的领域不很广泛。这种以全面统计报表为主的统计调查体系,面对日益发展的多种经济成分、多种经营方式等复杂多样的调查对象已经难以适应。u统计调查体系改革的目标模式是:建立以必要
17、的周期性普查为基础,经常性的抽样调查为主体,重点调查、科学推算等为补充的多种方式综合运用的统计调查体系。 2022-5-2334第三章第三章 统计整理统计整理u一、整理程序u二、统计分组u三、频数分布u四、统计图表数字不会说谎,但说谎的人会想出办法。 格罗夫纳 2022-5-2335一、整理程序一、整理程序u审核:计算审核,逻辑审核u分组:分类,分组u汇总:手工汇总,电子汇总u表现:列表,图示2022-5-2336 二、统计分组二、统计分组u概念:划分一个总体为若干组u原则:穷尽,互斥u作用:划分类型,研究结构,分析关系u方法:品质标志分组,数量标志分组2022-5-2337 三、频数分布三、
18、频数分布u概念:总体单位在各组的分布状况u种类:品质数列,变量数列 单项数列,组距数列u编制:全距,组距,组限,频数u类型:钟型,U型,J型2022-5-2338 组距数列编制举例组距数列编制举例 某生产车间50名工人日加工零件数如下: 117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 1
19、15 139 128 124 1212022-5-2339u第一步,对数据进行排序,计算全距(R) 1 0 7 1 0 8 1 0 8 11 0 11 2 11 2 11 3 114 135 137 139 139 u第二步,确定组数(k)和组距(i) k=4 i=Rk i=10 k=1+3.3 Lg N u第三步, 设置组限(u,l) 离散变量与连续变量的不同要求u第四步,计算各组次数(f)组距数列编制举例(续1)2022-5-2340组距数列编制举例组距数列编制举例(续(续2)按零件数按零件数分组分组 次数次数(频数频数) 频率频率 (%) 向上累计向上累计 向下累计向下累计次数次数频频
20、率率(%) 次数次数频频 率率(%)110以下以下 3 6 3 6 50 100110120 13 26 16 32 42 84120130 24 48 40 80 20 40130140 10 20 50 100 4 8合计合计 50 100 50名工人日产零件数2022-5-2341分布数列类型分布数列类型-钟型分布钟型分布日产量日产量 ( (件件) )2022-5-2342分布数列类型-型分布2022-5-2343 分布数列类型分布数列类型-J J型分布型分布(1)(1) 价格需求2022-5-2344分布数列类型分布数列类型-J J型分布型分布(2)(2)价格供应2022-5-2345
21、四、统计图表四、统计图表u统计表: 主词栏、宾词栏 简单表、分组表、复合表u统计图: 分布图、条形图、圆形图 2022-5-2346统计表举例统计表举例主词总标题横行标题纵栏标题数字资料宾词2022-5-2347统计图举例统计图举例直方图2022-5-2348 统计图举例统计图举例(续(续1)条形图2022-5-2349 统计图举例统计图举例(续(续2) 19982002年我国进出口总额(亿美元)复合条形图2022-5-2350统计图举例统计图举例(续(续3)圆形图2022-5-2351Errors in Presenting DatauChart Junk 垃圾数图表uNo Relative
22、 Basis 无相对基准uCompressing Vertical Axis 压缩纵轴uNo Zero Point on Vertical Axis 纵轴无零点2022-5-2352垃圾数图表垃圾数图表差的表示好的表示1960: $1.001970: $1.601980: $3.101990: $3.80最低工资最低工资0241960197019801990$2022-5-2353无相对基准无相对基准好的表示按年级统计的A按年级统计的A差的表示0100200300大一大一大二大二 大三大三 大四大四频数频数0%10%20%30%大一大一大二大二 大三大三 大四大四%2022-5-2354压缩纵
23、轴压缩纵轴好的表示季度销售季度销售差的表示025501季季2季季3季季 4季季$01002001季季 2季季3季季 4季季$2022-5-2355纵轴无零点纵轴无零点好的表示月销售量月销售量差的表示0204060一一 三三 五五 七七 九九 十一十一$36394245一一 三三 五五 七七 九九 十一十一$2022-5-2356第四章第四章 综合指标综合指标u一、总量指标u二、相对指标u三、平均指标统计学家通常醉心于平均数,而不着迷于更广泛的考虑。这一点很像一些英格兰人对瑞士的回忆:如果可以将它的山脉扔进它的湖泊,那么两种讨厌的东西将立即去除。 高尔顿2022-5-2357一、总量指标一、总量
24、指标u概念:反映总体规模、水平;绝对数u分类:时期指标、时点指标u计量:实物单位,价值单位u计算:直接计算、间接推算2022-5-2358总量指标举例总量指标举例u国内生产总值简称GDP,是由本国常住单位所创造的社会最终产品的价值总量,同时又是全社会各常住单位所创造的增加值的总和。uGDP(各部门总产出该部门中间消耗) 各部门的增加值uGDP总消费总投资净出口uGNP GDP付给国外的要素收入 + 来自国外的要素收入 GDP + 来自国外的要素收入净额 2022-5-2359二、相对指标二、相对指标u1 相对指标意义u2 相对指标形式u3 相对指标种类u4 相对指标原则2022-5-23601
25、 相对指标意义相对指标意义u相对指标是将两个性质相同或互有关联的指标数值通过对比求得的商数或比率;用以反映事物内部的结构、比例,事物发展的程度、强度,事物之间的联系、区别。u对比是统计分析的基本方法。通过对比显示事物的相对水平,可以更深入地说明事物发展的程度和差别,弥补总量指标的不足;提供事物之间共同的比较基础,便利对事物的鉴别和分析。所以说,相对指标具有说明和比较两大作用。2022-5-23612 相对指标形式相对指标形式u相对指标的指标数值大多是相对数,或称无名数。无名数是一种抽象化的数值,分为系数、倍数、成数、百分数、干分数等。u相对指标是由两个指标分别作为分子项与分母项对比而成的,其分
26、母项作为比较的基础,故称为基数。系数和倍数是将基数抽象为l而计算出来的相对数。成数、百分数、干分数是将基数抽象为10、100、1000计算的相对数,其中百分数最常用。u像人口密度、人均国民生产总值这类相对指标,将其分子项与分母项的计量单位同时使用,即以(人平方公里)、(元人)作为数值形式,此称有名数或名数。2022-5-23623 相对指标种类相对指标种类u计划完成相对指标u结构相对指标u比例相对指标u比较相对指标u动态相对指标u强度相对指标2022-5-23634 相对指标原则相对指标原则u保持可比性 u结合绝对数 u运用多指标 2022-5-2364 三、平均指标三、平均指标u 意义 一般
27、水平,坐落位置u 种类 静态平均数,动态平均数 u 作用 说明,比较,判断u 计算 数值平均数,位置平均数2022-5-2365 1 数值平均数数值平均数u算术平均数u调和平均数u几何平均数2022-5-2366日产量日产量( (公斤)公斤)工人数工人数 f组中值组中值 x日产总量日产总量 x f 3030以下以下 1010 ? ? ? ?* *101030304040 7070 3535 2450245040405050 9090 4545 4050405050506060 3030 5555 16501650合合 计计 200200 84008400 公公斤斤平平均均日日产产量量42200
28、8400 某车间200名工人日产量资料:算术平均数计算举例2022-5-2367 算术平均数算术平均数u基本公式: 标志总量/总体总量u计算形式: 简单平均,加权平均u数学性质: 离差、离差平方之和u是非标志: 成数是特殊的平均数 2022-5-2368 两个平均数是否矛盾两个平均数是否矛盾 工人工人 件件/小时小时 分钟分钟/件件 甲甲 3 20 乙乙 2 30 平均平均 2.5 252022-5-2369 调和平均数调和平均数u概念:倒数平均数u应用:算术平均数的变形u结论:对逆指标求平均2022-5-2370 企企 业业产值计划产值计划完成完成(%) (%) x x计划产值计划产值( (
29、万元万元) ) m / xm / x 实际产值实际产值( (万元万元) ) (m)(m) 甲甲 95 300 285 乙乙 105 900 945 丙丙 115 300 345合计合计 1500 1575%10515001575)()m(%xm 计计划划产产值值实实际际产产值值平平均均计计划划完完成成某局所属的三个企业的资料:调和平均数计算举例2022-5-2371 两个平均数是否矛盾两个平均数是否矛盾(续)(续)商品商品 P1 P0P1 / P0 ( % )P0 / P1 ( % )A 8 4 200 50B 3 6 50 200平均平均 125 1252022-5-2372 几何平均数几何
30、平均数u概念: 对数平均数u性质: 受极端值影响小u结论: 对比率、速度求平均2022-5-2373车间车间投入量投入量 产出量产出量 合格率合格率(%) x 一一 1000 800 80 二二 800 720 90 三三 720 504 7033%450%70%90%80三个车间平均合格率10005047205048007201000800%70%90%80 某企业三个连续作业车间的合格率:几何平均数计算举例2022-5-2374 2 位置平均数位置平均数u众数u中位数u四分位数2022-5-2375 众数众数u概念:频数最大的标志值u计算:单项数列,组距数列u公式:上限公式,下限公式 20
31、22-5-2376 年人均纯收入年人均纯收入 (千元)(千元)农户数农户数(户)(户)5以下以下2405648067110078700893209以上以上160合计合计3000111()()mmommmmmmffMLiffff111() ()mmommmmmmffMUiffff众数计算举例2022-5-2377 中位数中位数u概念: 序列正中间的标志值u计算: 单项数列,组距数列u公式: 上限公式,下限公式2022-5-2378 四分位数四分位数u四分位数:数据分为四份u十分位数:数据分为十份u百分位数:数据分为百份2022-5-2379 平均指标的关系和原则平均指标的关系和原则u 关系 数值
32、平均数之间的关系 数值平均数与位置平均数的关系u 原则 正视同质性 补充组平均 运用多指标2022-5-2380第五章第五章 变异与均衡指变异与均衡指标标u一、变异指标u二、偏度峰度u三、均衡指标当事实改变时,我就改变主意。你呢? 凯恩斯2022-5-2381一、变异指标一、变异指标u概念 反映总体内部差异程度或离散程度u作用 评价平均指标的代表性 测度现象发展过程的均衡性、稳定性 揭示总体分布的离中趋势 2022-5-2382u全距 u四分位差u平均差 u方差u标准差 u标准差系数变异指标种类代表着国内军舰建造最高水平的171“海口”号导弹驱逐舰 2022-5-2383标准差计算举例标准差计
33、算举例 ff)xx(2)(42x公公斤斤 日产量日产量(公斤)(公斤)工人数工人数f组中值组中值x20301025288030407035343040509045810506030555070合合 计计20012190f)xx(2 )(817956020012190公公斤斤 2022-5-2384标准差系数计算举例标准差系数计算举例%100 xv 组别组别平均数平均数标准差标准差标准差系数标准差系数 %甲甲70(件件)7.07(件)(件)10.1乙乙 7(台台)3.41(台)(台)48.7甲组日产量(件):60 、65 、70、75、80乙组日产量(台): 2、 5 、 7、 9、122022
34、-5-2385二、偏度峰度二、偏度峰度u1 统计动差u2 偏度指标u3 峰度指标2022-5-23861 统计动差统计动差u动差(又称矩),原是物理学上用以表示力与力臂对重心关系的术语。统计学上标志值与权数对平均数的关系,与此种关系十分相似。因此,统计学借用动差概念,描述次数分布的某些性质或特征。u一般地说,标志值与任意数(A)之差的K次方的算术平均数,称为标志值关于的K阶动差。u一阶原点动差即为算术平均数,二阶中心动差即为方差(标准差的平方)。所以,次数分布的集中趋势和离中趋势等特征,皆可由动差描述。 ()KXAff2022-5-23872 偏度指标偏度指标u笼统地说,偏度是指频数分布的非对
35、称形态及程度。频数分布的非对称形态依算术平均数与众数的大小关系分为两种:一为右偏态分布,简称右偏或正偏;一为左偏态分布,简称左偏或负偏。左、右偏缘于频数分布曲线向左、右方拖长尾巴,正、负偏缘于算术平均数与众数之差为正、负值。u严格地说,偏度是指偏态分布(包括正偏、负偏)的偏斜程度。而偏度的描述或测定,就是运用适当的指标或方法,度量分布偏斜程度的大小,揭示分布的形态特征。 2022-5-2388 偏度指标计算偏度指标计算u皮尔逊指标 以标准差为单位的算术平均数与众数的离差。 u三阶中心动差 分布负偏,三阶中心动差为负数;分布正偏,则为正数。为消除三阶中心动差立方单位的影响,也为不同水平数列偏度的
36、直接比较,须将三阶中心动差除以标准差的三次方,以获得数列偏度的相对度量。2323332022-5-2389频数分布(非)对称状况频数分布(非)对称状况Right-Skewed右偏的Left-Skewed左偏的Symmetric对称的 均值均值 = 中位数中位数 = 众数众数均值均值 中位数中位数 众数众数众数众数 中位数中位数 均值均值2022-5-23903 峰度指标峰度指标u峰度是频数分布的一种性质或特征。这一特征是指,某一数列的分布曲线与正态分布曲线相比较,是尖顶,还是平顶,其尖顶或平顶的程度如何。u峰度通常分为三种:尖顶峰度、正态峰度和平顶峰度。当标志值的次数,更密集分布于众数左右,使
37、分布曲线较正态分布曲线更为尖耸的,为尖顶峰度;当标志值的次数,完全符合正态分布的规律,分布曲线与正态分布曲线完全一致,为正态峰度,又称为标准峰度;当标志值的次数,更离散分布于众数左右,使分布曲线较正态分布曲线更为平坦的,为平顶峰度。2022-5-2391峰度指标计算峰度指标计算u偶数阶中心动差有一特点,即不论数列的离差为正或负,经偶数次乘方后,皆为正值。由于离差经偶数次乘方后,必加重较大离差的分量,能使它在度量分布的峰度中发挥作用。 u可以取数列的偶数阶中心动差,作为分布峰度的测度指标。偶数阶中心动差只能作为峰度的绝对度量,还必须经适当处理,形成一种峰度的相对度量的指标。u可以证明,正态分布的
38、四阶中心动差与其标准差的四次方之比值为3。所以,通常以数列的四阶中心动差与其标准差的四次方之比,作为测度峰度的指标。 33224442022-5-2392尖顶与平顶尖顶与平顶u峰度指标=3,分布为正态峰度,当峰度指标3时,表示频数分布比正态分布更集中,分布呈尖峰状态,3)(=3) (F ,则拒绝原假设H0,表明平均数值之间的差异是显著的,所检验的因素(A)对观察值有显著影响。若FF ,则不能拒绝原假设H0,表明所检验的因素(A)对观察值没有显著影响。 2022-5-23239多重比较多重比较多重比较是通过对总体平均数之间的配对比较来进一步检验到底哪些均值之间存在差异。Fisher提出的最小显著
39、差异方法(LSD)可用于判断到底哪些均值之间有差异。 LSD方法是对检验两个总体平均数是否相等的t检验方法的总体方差估计加以修正(用MSE来代替)而得到的。 2022-5-23240多重比较的步骤多重比较的步骤提出假设:H0: i = j (第i个总体的平均数等于第j个总体的平均数)H1: i j (第i个总体的平均数不等于第j个总体的平均数)计算检验统计量:做出决策:)(11kntnnMSExxtjiji若|t|t,拒绝H0;若|t|F 3.4903,拒绝原假设H0,说明彩电的品牌对销售量有显著影响;FB2.100846 F 3.2592,接受原假设H0,说明销售地区对彩电的销售量没有显著影
40、响差异源差异源SSdfMSFP-valueF crit 行行(因素因素A)13004.5534334.8518.10777 9.46E-053.4903 列列(因素因素B)2011.74502.9252.100846 0.1436653.2592 误差误差2872.712239.3917 总和总和17888.95192022-5-23250第十二章第十二章 相关分析相关分析u一、基本问题u二、相关系数u三、回归方程有其父必有其子。 中国谚语2022-5-23251一、基本问题一、基本问题u概念:函数关系、相关关系u类型:简单相关、复杂相关u任务:相关分析、回归分析2022-5-23252函数关
41、系函数关系u一一对应的确定关系。u设有两个变量 x 和 y ,变量 y 随变量 x 一起变化, 并完全依赖于 x 。 当变量 x 取某个数值时,y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量。u各观测点落在一条上。xy2022-5-23253相关关系相关关系 变量间关系不能用函数关系精确表达。 一个变量的取值不能由另一个变量唯一确定。当变量 x 取某个值时,变量 y 的取值可能有几个。 各观测点分布在直线周围。xy2022-5-23254 相关关系类型相关关系类型相关关系非线性相关非线性相关线性相关线性相关正正相相关关正正相
42、相关关负负相相关关负负相相关关完全相关完全相关不相关不相关2022-5-23255相关分析任务相关分析任务u对经济、管理现象之间相关关系的统计研究,主要解决两个方面的问题,或完成两个方面的任务:u其一,测定相关关系的密切程度,一般称为相关分析;u其二,揭示相关变量的互动规律,一般称为回归分析。2022-5-23256二、相关系数二、相关系数u概念:对两个变量之间线性相关程度和相关方向的度量。u公式:u举例:下页。22)()()(yyxxyyxxr2222 yynxxnyxxynr2022-5-23257 我国人均国民收入与人均消费金额数据我国人均国民收入与人均消费金额数据 单位单位: :元元年
43、份年份人均人均国民收入国民收入人均人均消费金额消费金额年份年份人均人均国民收入国民收入人均人均消费金额消费金额1981198219831984198519861987393.8419.14460.86544.11668.29737.73859.972492672893294064515131988198919901991199219931068.81169.21250.71429.51725.92099.56436907138039471148相关系数举例相关系数举例为研究我国人均消费水平的问题,把人均消费额记为y,把人均国民收入记为x。收集到19811993年的样本数据(xi ,yi),i
44、=1,2,,13,数据见下表。试计算相关系数。2022-5-23258相关关系计算结果相关关系计算结果u根据样本相关系数的计算公式有u人均国民收入与人均消费金额之间的相关系 数为 0.9987。9987. 074575226399135 .1282777.160733231374575 .1282799.915617313222222 yynxxnyxxynr2022-5-23259相关系数取值及其意义相关系数取值及其意义r 的取值范围是 -1, 1 |r|=1, 为完全相关 r =1, 为完全正相关 r =-1, 为完全负相关 r = 0, 不存在线性相关关系 -1r0,为负相关 0t2,拒
45、绝H0 若tt(13-2)=2.201,拒绝H0,人均 消费金额与人均国民收入之间的相关关系显著。2022-5-23262三、回归方程三、回归方程u概念:对变量之间互动规律的具体模式的量化描述。u类型:一元回归,多元回归。u举例:下页。u评价:判定系数,估计标准误差。2022-5-23263回归方程类型回归方程类型一个自变量两个及以上自变量回归方程回归方程多元回归多元回归一元回归一元回归线性线性回归回归非线性非线性回归回归线性线性回归回归非线性非线性回归回归2022-5-23264回归方程举例回归方程举例 根据前例数据,配合人均消费金额对人均国民收入的一元线性回归方程,并以最小平方法求解方程中
46、的两个参数,得2229.54526378. 073077.98652638. 061538.5735 .1282777.160733231374575 .1282799.915617313010211y = 54.22286 + 0.52638 x2022-5-23265回归方程图示回归方程图示y = 54.22286 + 0.52638 x020040060080010001200140005001000150020002500人均消费与人均国民收入的回归人均消费与人均国民收入的回归2022-5-23266判定系数判定系数 回归平方和占总离差平方和的比例niiniiniiniiyyyyyyy
47、ySSTSSRr1212121221 评价回归直线的拟合程度 取值范围在 0 , 1 之间 r2 1,说明回归方程拟合得越好 r20,说明回归方程拟合得越差判定系数等于相关系数的平方,即r2(r)22022-5-23267估计标准误差估计标准误差 估计标准误差是实际观察值与回归估计值离差平方和的均方根,反映实际观察值在回归直线周围的分散状况。它从另一个角度说明了回归直线的拟合程度。其计算公式为:22111212nyxbyaynyySniiiniiniiniiiy上例的计算结果为14.9496782022-5-23268利用回归方程进行估计或预测利用回归方程进行估计或预测 利用估计的回归方程,
48、对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值的一个估计值E(y0),这就是估计或预测。前例子中,当人均国民收入为 2000 元时,我们可以估计人均消费金额的的平均值为)(98.1160200052638. 022286.540元y2022-5-23269相关分析与回归分析的区别相关分析与回归分析的区别u相关分析中,变量x 变量y 处于平等的地位;回归分析中,变量y 称为因变量,处在被解释的地位,x称为自变量,用于预测因变量的变化。u相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量。u相关分析主要
49、是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制。 2022-5-23270正确运用相关分析正确运用相关分析u相关分析只是一种重要的研究工具、分析手段,在运用它于具体研究对象时,必须以有关的科学理论、专业知识为指导。u变量间的相随变动或共同变动,可能确实彼此之间存有因果关系或互为因果,也可能没有直接关系。例,由于观察资料的偶然巧合,可能会出现诸如某地白酒消费量与自杀者人数同时增加、卷烟销售量与患肺病人数同时上升的数据。其实,它们之间并无直接关联。所以,必须在定性分析的基础上,正确运用相关分析方法。2022-5-23271
50、第十三章第十三章 统计综合评价统计综合评价u一、综合评价概述 u二、评价指标选择u三、指标权重确定u四、综合评价结果2022-5-23272一、综合评价概述一、综合评价概述u单项评价是利用一个统计指标对事物的某一个方面作出判断。u综合评价,则是根据研究的目的,建立一个统计指标体系,对事物的各个方面进行定量分析,得出概括性的结论,从而揭示事物的本质及其发展规律。u综合评价的基本步骤:建立评价指标体系量化处理评价指标确定评价指标权重综合最终评价结果。2022-5-23273二、评价指标选择二、评价指标选择u定性选择方法有综合法和分析法: 综合法一般是通过研讨会或征询意见的方式,集中专家们的意见,以