1、本课程的主要内容本课程的主要内容 第一章第一章 导言导言 第二章第二章 数据搜集数据搜集 第三章第三章 数据整理数据整理 第四章第四章 集中趋势和离中趋势集中趋势和离中趋势 第五章第五章 参数估计与假设检验参数估计与假设检验 第六章第六章 方差分析方差分析 第七章第七章 相关与回归分析相关与回归分析 第八章第八章 时间序列分析时间序列分析 第九章第九章 统计指数统计指数 第十章第十章 SPSS简介简介第一章第一章 导言导言 统计学的概念统计学的概念 统计学的产生与发展统计学的产生与发展 统计学的分类统计学的分类 统计学中的常用概念统计学中的常用概念第一章第一章 导导 言言一、统计学的概念一、统
2、计学的概念 统计与统计学统计与统计学 “统计统计”是指对大量事物进行汇总计数,故可是指对大量事物进行汇总计数,故可简单地说统计就是总起来计量,即统而计之。简单地说统计就是总起来计量,即统而计之。从三个角度理解从三个角度理解“统计统计”的含义:的含义:统计活动统计活动(统计实践、统计工作)指根据统计目(统计实践、统计工作)指根据统计目的及要求,运用科学的方法,对客观事物或人类实的及要求,运用科学的方法,对客观事物或人类实践活动的数据资料进行调查、整理、分析的过程。践活动的数据资料进行调查、整理、分析的过程。统计活动一般按照统计设计、统计调查、统计整统计活动一般按照统计设计、统计调查、统计整理、统
3、计分析和统计资料的开发利用这几个阶段依理、统计分析和统计资料的开发利用这几个阶段依次进行。如下图所示。次进行。如下图所示。有组织、有计划有组织、有计划地搜集资料。地搜集资料。要求:准确、完要求:准确、完整、及时整、及时对调查资料去对调查资料去伪存真、去粗伪存真、去粗取精、科学分取精、科学分类、浓缩简化类、浓缩简化描述性分析、描述性分析、推断分析、决推断分析、决策分析。策分析。要求:定性定要求:定性定量结合量结合统计资料:统计资料:是统计实践活动的成果或产品,既包括是统计实践活动的成果或产品,既包括调查得到的原始资料,也包括整理和分析形成的系调查得到的原始资料,也包括整理和分析形成的系统的统计资
4、料,通常以调查表、统计表、统计图的统的统计资料,通常以调查表、统计表、统计图的形式提供。形式提供。统计学:统计学:是关于统计理论和方法的科学,是研究如是关于统计理论和方法的科学,是研究如何对社会何对社会总体的数量特征和规律总体的数量特征和规律进行描述、推断、进行描述、推断、认识的一门学科。认识的一门学科。三种理解相互联系,不可分割。三种理解相互联系,不可分割。统计活动统计活动为我们描述、推断、认识事物的统计规律为我们描述、推断、认识事物的统计规律提供必不可少的提供必不可少的统计资料统计资料,同时,同时统计活动统计活动又需要正又需要正确的统计理论和方法作指导,因此确的统计理论和方法作指导,因此统
5、计学统计学对于统计对于统计实践活动的深化和发展具有重要指导意义。实践活动的深化和发展具有重要指导意义。不断发展的不断发展的统计学统计学又是又是统计实践活动统计实践活动的结晶,是的结晶,是统统计活动计活动经验提炼、升华的结果。经验提炼、升华的结果。统计理论来源于统计实践活动,统计实践检验统计统计理论来源于统计实践活动,统计实践检验统计理论,并对统计理论的发展不断提出新的要求。理论,并对统计理论的发展不断提出新的要求。统统计理论源于统计实践,又高于统计实践。计理论源于统计实践,又高于统计实践。教材对统计学的定义教材对统计学的定义 统计学是一门对群体现象的数量特征进行统计学是一门对群体现象的数量特征
6、进行计量描述和分析推断的科学。计量描述和分析推断的科学。统计学研究的对象是统计学研究的对象是群体现象群体现象;统计学所探索的是群体现象统计学所探索的是群体现象数量表现数量表现的的内在内在规律性规律性;统计学研究的是对群体现象的数量特征进行统计学研究的是对群体现象的数量特征进行计量描述计量描述和和分析推论分析推论的方法。的方法。二、统计学的产生与发展二、统计学的产生与发展 我国原始时期,人类最初利用手指、石子、小我国原始时期,人类最初利用手指、石子、小木棍、绳索等工具进行计数。木棍、绳索等工具进行计数。古书记载:古书记载:“事大,大结其绳;事小,小结其事大,大结其绳;事小,小结其绳,绳,之多少,
7、随物众寡之多少,随物众寡”。奴隶社会:进行较系统的人口、土地等统计活奴隶社会:进行较系统的人口、土地等统计活动。如我国公元前动。如我国公元前21世纪的夏禹时期,全国有世纪的夏禹时期,全国有人口约人口约1335万人,土地万人,土地2438万顷。万顷。最早最早的统计数据资料。的统计数据资料。封建社会:建立人口、土地登记调查制度。封建社会:建立人口、土地登记调查制度。现代社会:统计活动已渗透到人类社会生活、现代社会:统计活动已渗透到人类社会生活、生产经营活动、科学研究等各个方面。统计已生产经营活动、科学研究等各个方面。统计已成为社会分工中一个独立的部门和专业。成为社会分工中一个独立的部门和专业。结绳
8、记事结绳记事 根据统计学的发展历程,统计学可分为三个时期:根据统计学的发展历程,统计学可分为三个时期:1.1.古典统计学时期(古典统计学时期(1717世纪中叶到世纪中叶到1818世纪末世纪末萌芽期)萌芽期)两大学派:两大学派:国势学派、政治算术学派国势学派、政治算术学派 国势学派国势学派创始人:德国的海尔门创始人:德国的海尔门.康令康令(H.Conring,1606-H.Conring,1606-16811681)研究方法:研究方法:对国家重要事项的记述,几乎完全偏重于对国家重要事项的记述,几乎完全偏重于品质品质方面而忽视了量的分析。方面而忽视了量的分析。有名无实的统计学 政治算术学派政治算术
9、学派创始人:英国威廉创始人:英国威廉.配第配第(William Petty,1623-1676)研究方法:研究方法:从数量方面研究社会经济现象。从数量方面研究社会经济现象。2 2.近代近代统计学时期统计学时期(18(18世纪末到世纪末到1919世纪末世纪末成长期)成长期)两大学派:两大学派:数理统计学派、社会统计学派数理统计学派、社会统计学派 数理统计学派数理统计学派创始人:比利时的阿道夫创始人:比利时的阿道夫.凯特勒凯特勒(AdolpheAdolphe Quetelet,1796-1874 Quetelet,1796-1874)研究方法:研究方法:用大数定律从社会经济现象复杂不定的用大数定律
10、从社会经济现象复杂不定的偶然性中寻找其规律性。偶然性中寻找其规律性。社会统计学派社会统计学派创始人:创始人:德国的克尼斯德国的克尼斯(K.G.A.Knies)研究方法:研究方法:在对统计资料进行搜集、整理、分析的在对统计资料进行搜集、整理、分析的基础上,明确基础上,明确社会经济社会经济现象内部的联系和规律性。现象内部的联系和规律性。有实无名的统计学3 3.现代现代统计学时期统计学时期(20(20世纪初到现在世纪初到现在迅速发展期)迅速发展期)新的统计理论与方法大量涌现。新的统计理论与方法大量涌现。英国统计学家卡尔英国统计学家卡尔.皮尔逊(皮尔逊(K.Pearson,1857-1936K.Pea
11、rson,1857-1936)的卡方分布理论。的卡方分布理论。戈塞特戈塞特(W.S.Gosset(W.S.Gosset,1876-1937)1876-1937)的小样本的小样本t t分布理论分布理论费希尔(费希尔(R.A.Fisher,1890-1962R.A.Fisher,1890-1962)的)的F F分布理论及实验分布理论及实验设计方法。设计方法。波兰统计学家内曼(波兰统计学家内曼(J.Neyman,1894-1981J.Neyman,1894-1981)和英国统)和英国统计学家皮尔逊(计学家皮尔逊(E.S.Pearson,1895-1980E.S.Pearson,1895-1980)的
12、置信区间)的置信区间估计理论和假设检验理论。估计理论和假设检验理论。非参数统计方法、时间序列分析、探索性数据分析、非参数统计方法、时间序列分析、探索性数据分析、统计抽样技术、多元统计分析等。统计抽样技术、多元统计分析等。三、统计学的分类三、统计学的分类 统计学按照发展阶段和侧重点不同,可分为:统计学按照发展阶段和侧重点不同,可分为:描述统计学和推断统计学描述统计学和推断统计学 统计学按照理论与实践应用的关系,可分为:统计学按照理论与实践应用的关系,可分为:理论统计学和应用统计学理论统计学和应用统计学1.描述统计学和推断统计学描述统计学和推断统计学 描述统计学:描述统计学:对数据资料的整理、汇总
13、、归纳和计算,对数据资料的整理、汇总、归纳和计算,通过对数据特征的描述,结合统计图表把结果表现出来。通过对数据特征的描述,结合统计图表把结果表现出来。内容主要包括:统计指标、统计调查、统计整理、统内容主要包括:统计指标、统计调查、统计整理、统计图表、集中趋势测度、离散程度测度、统计指数等理论计图表、集中趋势测度、离散程度测度、统计指数等理论和方法。和方法。描述统计学是推断统计学的基础描述统计学是推断统计学的基础 推断统计学:推断统计学:通过抽样调查得到样本,利用样本数据推断通过抽样调查得到样本,利用样本数据推断总体特征。总体特征。内容主要包括:概率分布、参数估计、假设检验、方内容主要包括:概率
14、分布、参数估计、假设检验、方差分析、相关与回归分析、统计决策等差分析、相关与回归分析、统计决策等 推断统计学是描述统计学的拓展、是现代统计学的核心。推断统计学是描述统计学的拓展、是现代统计学的核心。2.理论统计学和应用统计学理论统计学和应用统计学 理论统计学理论统计学:以概率论为基础,研究随机变量变化规:以概率论为基础,研究随机变量变化规律,阐述统计学数学原理。律,阐述统计学数学原理。内容包括内容包括:概率论、抽样理论、实验设计、估计理论、:概率论、抽样理论、实验设计、估计理论、假设检验、决策理论、非参数统计、序列分析、随机假设检验、决策理论、非参数统计、序列分析、随机过程。过程。应用统计学:
15、应用统计学:着重研究统计方法如何应用于某个具体着重研究统计方法如何应用于某个具体的领域,如何解决具体问题。的领域,如何解决具体问题。既包括各领域通用的方法,如参数估计、假设检验、既包括各领域通用的方法,如参数估计、假设检验、方差分析等,还包括各领域特有的方法(如经济统计方差分析等,还包括各领域特有的方法(如经济统计学中的指数分析、统计决策及产品质量统计管理等)。学中的指数分析、统计决策及产品质量统计管理等)。应用统计学包括:应用统计学包括:具有自然科学和技术科学性质的学科:具有自然科学和技术科学性质的学科:生物统计、心理统计、气象统计、统计物生物统计、心理统计、气象统计、统计物理、医药卫生统计
16、、地质统计。理、医药卫生统计、地质统计。社会经济统计学:社会经济统计学:人口统计学、经济统计(工商统计)、历人口统计学、经济统计(工商统计)、历史统计学、心理统计学、社会统计学、环境史统计学、心理统计学、社会统计学、环境统计学。统计学。四、统计学中的常用概念四、统计学中的常用概念总体、总体单位、样本总体、总体单位、样本 总体总体是统计研究的客观对象的全体,是是统计研究的客观对象的全体,是由客观存在的、具有某种共同性质的多个个由客观存在的、具有某种共同性质的多个个体构成的整体。体构成的整体。总体总体具有大量性、同质性、差异性的特征具有大量性、同质性、差异性的特征 总体单位总体单位是组成总体的每个
17、个体。是组成总体的每个个体。样本样本是从总体中抽取的一部分个体所组是从总体中抽取的一部分个体所组成的集合。成的集合。统计标志、统计指标与统计变量统计标志、统计指标与统计变量 统计标志(简称标志)统计标志(简称标志):用以描述或体现:用以描述或体现总体单总体单位位属性或特征属性或特征的名称。的名称。如人口总体中的每个人,性别、年龄、职业、身如人口总体中的每个人,性别、年龄、职业、身高、体重、文化程度、民族等都是标志。高、体重、文化程度、民族等都是标志。标志的分类:标志的分类:按按性质性质不同不同:品质标志、数量标志品质标志、数量标志品质标志:用文字表示属性品质标志:用文字表示属性 数量标志:用数
18、字表示特征数量标志:用数字表示特征 按按变异情况变异情况不同不同:不变标志、可变标志不变标志、可变标志 不变标志:不变标志:各单位具体表现相同(总体的同质性)各单位具体表现相同(总体的同质性)可变标志:可变标志:各单位具体表现不同(总体的差异性)各单位具体表现不同(总体的差异性)如某高校学生总体中,身份是不变标志、而身高、如某高校学生总体中,身份是不变标志、而身高、年龄、出生地、专业等都是可变标志年龄、出生地、专业等都是可变标志 统计指标(简称指标)统计指标(简称指标):用以说明统计:用以说明统计总体综总体综合数量特征合数量特征的的名称及其数值。名称及其数值。特点:具体性;综合性。特点:具体性
19、;综合性。如浙江省如浙江省2005年的国内生产总值为年的国内生产总值为13365亿亿元;人口总数为元;人口总数为4434万等。万等。指标指标按所反映的数量特点不同分为按所反映的数量特点不同分为数量指标数量指标(绝对数)和(绝对数)和质量指标质量指标(相对数、平均数)相对数、平均数)。如:产品合格率、市场占有率如:产品合格率、市场占有率质量指标质量指标 标志与指标的区别与联系:标志与指标的区别与联系:联系:(联系:(1)一些数量标志汇总可以得到指标的数值)一些数量标志汇总可以得到指标的数值。区别:(区别:(1)标志是说明总体单位特征的,而指标是说)标志是说明总体单位特征的,而指标是说明明统统计总
20、体数量特征的;计总体数量特征的;(2 2)数量标志与指标之间存在转换关系。由于研)数量标志与指标之间存在转换关系。由于研究目的或范围的变化,原来的总体(总体单位)变成究目的或范围的变化,原来的总体(总体单位)变成总体单位(总体),相应的指标(标志)就变成标志总体单位(总体),相应的指标(标志)就变成标志(指标)。(指标)。(2)标志的具体表现,有的用数值、有的用文字)标志的具体表现,有的用数值、有的用文字表示,而指标都是用数值表示的。表示,而指标都是用数值表示的。统计变量:统计变量:是统计指标、数量标志和品质标志是统计指标、数量标志和品质标志的总称。变量的具体表现称为变量值。的总称。变量的具体
21、表现称为变量值。变量的分类:变量的分类:1.按照变量值是否连续分为:连续型变量和离按照变量值是否连续分为:连续型变量和离散型变量;散型变量;2.按照变量所受影响因素的不同分为:确定型按照变量所受影响因素的不同分为:确定型变量和随机型变量;变量和随机型变量;3.按照变量反映数据的计量尺度不同分为:定按照变量反映数据的计量尺度不同分为:定性变量和定量变量。性变量和定量变量。五、常用的统计学软件五、常用的统计学软件 ExcelExcel电子表格处理软件。在目前的日常报表工作电子表格处理软件。在目前的日常报表工作中相当常见且较为普及,同时其描述统计的功能已中相当常见且较为普及,同时其描述统计的功能已完
22、全具备。能满足简单的统计分析与处理。完全具备。能满足简单的统计分析与处理。SAS SAS(Statistic Analysis System)(Statistic Analysis System)。具有完备的。具有完备的数据访问、数据管理、数据分析和数据呈现功能。数据访问、数据管理、数据分析和数据呈现功能。从其优点来看,对不同的数据库、不同的应用软件、从其优点来看,对不同的数据库、不同的应用软件、不同等级的用户和不同的计算机平台均能进行有效不同等级的用户和不同的计算机平台均能进行有效处理。处理。SPSSSPSS(Statistical Package for the Social (Stati
23、stical Package for the Social Science)Science)。社会科学用的一个组合式统计软件包。它。社会科学用的一个组合式统计软件包。它集数据整理、分析过程、结果输出等功能于一身。集数据整理、分析过程、结果输出等功能于一身。可采用完全窗口菜单运行管理方式、程序运行可采用完全窗口菜单运行管理方式、程序运行管理方式和混合运行管理方式。管理方式和混合运行管理方式。views views 是当今世界上最流行的计量经济学软件之一,是当今世界上最流行的计量经济学软件之一,拥有数据处理、作图、统计分析、建模分析、预测和拥有数据处理、作图、统计分析、建模分析、预测和模拟六大类功
24、能,且操作简便。模拟六大类功能,且操作简便。Statistic Statistic 所能作的统计分析内容与所能作的统计分析内容与SPSSSPSS、SASSAS区别区别不大,但有更大的优点:运行速度快;菜单栏上有详不大,但有更大的优点:运行速度快;菜单栏上有详细的统计专业名词,方便用户理解,并可配合中文使细的统计专业名词,方便用户理解,并可配合中文使用,增加可读性;在图形模块中能生产图形模块。用,增加可读性;在图形模块中能生产图形模块。MatLabMatLab 数学软件,其中包含概率统计部分。数学软件,其中包含概率统计部分。教材、参考书一一.教材:教材:李心愉,袁诚李心愉,袁诚.应用经济统计学(第二版)应用经济统计学(第二版).北京:北京:北京大学出版社,北京大学出版社,2008二二.参考书:参考书:1.刘思峰等主编刘思峰等主编.应用统计学应用统计学.北京:高等教育北京:高等教育出版社,出版社,2007 2.李金昌李金昌,苏为华苏为华.统计学统计学.北京:机械工业出版北京:机械工业出版社,社,2009