1、第第 1 章章 数据与统计学数据与统计学l1.1 统计数据与统计学统计数据与统计学l1.2 统计学的产生和发展统计学的产生和发展l1.3 统计学的分科统计学的分科l1.4 统计数据的来源统计数据的来源l1.5 统计数据的质量统计数据的质量l1.6 统计学的基本概念统计学的基本概念l 本章小结本章小结学习目标学习目标理解统计学的含义理解统计学的含义理解统计学与统计数据的关系理解统计学与统计数据的关系了解统计学的分科了解统计学的分科了解统计学的发展过程了解统计学的发展过程理解统计中的几个基本概念理解统计中的几个基本概念 统计学统计学STATISTICS1.1 统计数据与统计学统计数据与统计学什么是
2、统计学什么是统计学?l1.数据搜集:取得数据l2.数据分析:分析数据 l3.数据表述:图表展示数据 4.数据解释:结果的说明统计研究的过程统计研究的过程收集数据收集数据整理数据整理数据解释数据解释数据分析数据分析数据统计规律统计规律(一些例子一些例子)正常条件下新生婴儿的男女性别比为107:100投掷一枚质地均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现16点的频率各为1/6农作物的产量与施肥量之间存在相关关系统计学统计学STATISTICS1.2 统计学的产生和发展统计学的产生和发展l统计的产生统计的产生 n 统计的发展统计的发展 (1)17(1)17世纪中叶世纪中叶1818世
3、纪世纪萌芽期萌芽期 (2(2)18191819世纪末世纪末 近代期近代期 (3(3)2020世纪世纪至今至今 现代期现代期历史上著名的统计学家历史上著名的统计学家历史上著名的统计学家历史上著名的统计学家统计学统计学STATISTICS1.3 统计学的分科统计学的分科统计方法统计方法统计方法统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验描述统计描述统计(descriptive statistics)研究数据收集、整理和描述的统计学分支 内容l搜集数据l整理数据l展示数据l描述性分析 目的l描述数据特征l找出数据的基本规律推断统计推断统计(inferential stat
4、istics)研究如何利用样本数据来推断总体特征的统计学分支内容l参数估计l假设检验目的l对总体特征作出推断描述统计与推断统计的关系描述统计与推断统计的关系理论统计与应用统计理论统计与应用统计理论统计理论统计l研究统计学的一般理论l研究统计方法的数学原理应用统计应用统计l研究统计学在各领域的具体应用统计学统计学STATISTICS1.4 统计统计数据的来源数据的来源一、间接获取的数据一、间接获取的数据 二、直接获取的数据二、直接获取的数据 统计学统计学STATISTICS间接取得的数据间接取得的数据间接取得的数据间接取得的数据中国统计出版社n统计部门和政府部门公布的有关资料,如各类统计年鉴n各
5、类经济信息中心、信息咨询机构、专业调查机构等提供的数据n各类专业期刊、报纸、书籍所提供的资料n各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料n从互联网或图书馆查阅到的相关资料 提供统计数据的部分政府网站提供统计数据的部分政府网站中国政府及相关机构中国政府及相关机构 网址网址数据内容数据内容国家统计局http:/统计年鉴、统计月报等国务院发展研究中心信息网http:/宏观经济、财经、货币金融等 中国经济信息网http:/经济信息及各类网站华通数据中心http:/国家统计局授权的数据中心中国决策信息网http:/决策知识及案例三农数据网http:/三农信息、论坛及相关网站
6、提供统计数据的部分政府网站提供统计数据的部分政府网站美国政府机构美国政府机构 网址网址数据内容数据内容人口普查局http:/www.census.gov人口和家庭等联邦储备局http:/www.bog.frb.fed.us货币供应、信誉、汇率等预算编制办公室http:/www.whitehouse.gov/omb财政收入、支出、债券等商务部http:/www.doc.gov商业、工业等统计学统计学STATISTICS直接取得的数据直接取得的数据普查普查(census)为特定目的专门组织的非经常性全面调查l2.通常是一次性或周期性的l3.一般需要规定统一的标准调查时间l4.数据的规范化程度较高l
7、5.应用范围比较狭窄抽样调查抽样调查(sampling survey)l1.从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法 统计学统计学STATISTICS1.5 统计统计数据的质量数据的质量数据的误差数据的误差抽抽样样误误差差抽样框误差回答误差无回答误差调查员误差非非抽抽样样误误差差数数据据的的误误差差抽样误差抽样误差(sampling error)由于抽样的随机性所带来的误差 所有样本可能的结果与总体真值之间的平均性差异 影响抽样误差大小的因素l样本量的大小l总体的变异性非抽样误差非抽样误差(non-sampling error)相对于抽样误差而
8、言除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异存在于所有的调查之中l概率抽样,非概率抽样,全面性调查有抽样框误差、回答误差、无回答误差、调查员误差、测量误差误差的控制误差的控制抽样误差可计算和控制非抽样误差的控制l调查员的挑选l调查员的培训l督导员的调查专业水平l调查过程控制l调查结果进行检验、评估l现场调查人员进行奖惩的制度统计学统计学STATISTICS1.6 统计学的基本概念统计学的基本概念l统计总体与总体单位统计总体与总体单位 l标志与指标标志与指标l变异、变量和变量值变异、变量和变量值总体由统计任务的要求决定的、客观存在的、并在某一相同性质基础上结合起来的、许
9、多个别事物组成的整体,称统计总体,简称总体。总体单位构成统计总体的每个独立的个别事物,叫总体单位。总体的三大特征:同质性大量性差异性总体可分为有限总体和无限总体:有限总体总体单位数有限而可以计数的总体。无限总体总体单位数无限不可以计数的总体。l标志说明总体单位特征与属性的名称。l标志分类:l品质标志与数量标志l不变标志与可变标志 l标志值(标志表现)标志的具体取值。l指标指标说明总体量的特征的概念说明总体量的特征的概念或范畴,及通过统计实践活动可得或范畴,及通过统计实践活动可得到指标的具体数值的总称。到指标的具体数值的总称。l指标与标志的区别与联系指标与标志的区别与联系 l变异变异可变标志在总
10、体各单位具体表现上的差别可变标志在总体各单位具体表现上的差别称为变异。称为变异。l变量变量可变的数量标志称为变量。可变的数量标志称为变量。l变量值变量值变量的数值表现为变量值。变量的数值表现为变量值。连续变量连续变量离散变量离散变量 总体和样本总体和样本总体总体(population)l所研究的全部个体(数据)的集合,其中的每一个元素称为个体 l分为有限总体和无限总体l有限总体的范围能够明确确定,且元素的数目是有限的l无限总体所包括的元素是无限的,不可数的样本样本(sample)l从总体中抽取的一部分元素的集合l构成样本的元素的数目称为样本容量 参数和统计量参数和统计量参数参数(paramet
11、er)l描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值l所关心的参数主要有总体均值()、标准差()、总体比例()等l总体参数通常用希腊字母表示 统计量统计量(statistic)l用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数l所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等l样本统计量通常用小写英文字母表示 统计中的几个基本概念统计中的几个基本概念几种常用的统计软件几种常用的统计软件(Software)l典型的统计软件典型的统计软件lSASlSPSSlMINITABlSTATISTICAlExcel本章小结本章小结统计数据与统计学统计数据与统计学统计学的产生和发展统计学的产生和发展统计学的分科统计学的分科统计数据的来源和质量统计数据的来源和质量统计学与其他学科的关系统计学与其他学科的关系统计学的基本概念统计学的基本概念