1、统计学统计学第第1章章 导论导论统计及其应用领域统计及其应用领域1.1 统计数据的类型统计数据的类型1.2 统计中的几个基本概念统计中的几个基本概念1.3 学习统计学的意义学习统计学的意义 如何理解这些统计结论?如何理解这些统计结论?1怕老婆的丈怕老婆的丈夫的心脏病夫的心脏病的几率较大!的几率较大!3“由于某种由于某种疾病,平均疾病,平均10001000人中死人中死亡人数为亡人数为3.23.2人人”21.1统计及其应用领域统计及其应用领域1.1.1 什么是统计学什么是统计学1.统计工作统计工作n收集数据的活动收集数据的活动2.统计数据统计数据对现象计量的结果对现象计量的结果 3.统计学统计学n
2、分析数据的方法与技术分析数据的方法与技术什么是统计学?1.数据搜集:例如,调查与试验2.数据整理:例如,分组3.数据展示:例如,图和表4.数据分析:例如,回归分析 统计学是一门收集、整理和分析数据的方法科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识统计数据的内在规律(一些例子)1.正常条件下新生婴儿的性别比为107:1002.投掷一枚均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现16点的频率各为1/63.农作物的产量与施肥量之间存在相关关系统计方法统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验统计方法统计方法描述统计描述统计1.内容内
3、容n搜集数据搜集数据n整理数据整理数据n展示数据展示数据2.目的目的n描述数据特征描述数据特征n找出数据的基本规律找出数据的基本规律推断统计推断统计1.内容内容参数参数估计估计假设检验假设检验2.目的目的对总体特征作出对总体特征作出推断推断样样本本总体总体1.1.2 统计的应用领域统计的应用领域经济学经济学管理学管理学社会学社会学医学医学企业发展战略企业发展战略产品质量管理产品质量管理市场研究市场研究财务分析财务分析经济预测经济预测人力资源管理人力资源管理1.2 统计数据的类型统计数据的类型1.2.1分类数据、顺序数据和数值型数据分类数据、顺序数据和数值型数据对事物进行平行的分类,各类别可以指
4、定数字代码对事物进行平行的分类,各类别可以指定数字代码表示表示如:男性、女性;医药行业、家电行业、纺织品行业分类数据分类数据对事物分类的同时给出各类别的顺序,数据表现对事物分类的同时给出各类别的顺序,数据表现为为“类别类别”,但有序,但有序如:一等品、二等品、三等品;优、良、中、及格、不及格顺序数据顺序数据按数字尺度测量的观察值,其结果表现为具体按数字尺度测量的观察值,其结果表现为具体的数值的数值如:50cm;100kg数值型数值型数据数据1.2.2 观测数据和实验数据观测数据和实验数据观测数据观测数据 通过调查或观测而收通过调查或观测而收集到的数据,是在没有集到的数据,是在没有对事物人为控制
5、的条件对事物人为控制的条件下得到的下得到的 GDP,CPI实验数据实验数据 在实验中控制实验在实验中控制实验对象而收集到的数据对象而收集到的数据 新药疗效的实验数新药疗效的实验数据据1.2.3 截面数据和时间序列数据截面数据和时间序列数据截面数据截面数据 在相同或近似相同在相同或近似相同的时间点上收集的的时间点上收集的数据,用于描述现数据,用于描述现象在某一时刻的变象在某一时刻的变化情况化情况时间序列数据时间序列数据在不同时间收集到的在不同时间收集到的数据数据,按时间顺序,按时间顺序收集的,用于描述现收集的,用于描述现象随时间变化的情况象随时间变化的情况统计数据的类型统计数据的类型统计数据统计
6、数据的类型的类型数据的四种计量尺度数据的四种计量尺度 数据的计量尺度数据的计量尺度定类尺度定类尺度1.计量层次最低计量层次最低2.对事物进行平行的分类对事物进行平行的分类3.各类别可以指定数字代码表示各类别可以指定数字代码表示4.使用时必须符合类别穷尽和互斥的要求使用时必须符合类别穷尽和互斥的要求5.数据表现为数据表现为“类别类别”6.具有具有=或或 的数学特性的数学特性例如,人口的民族有汉族、回族、例如,人口的民族有汉族、回族、哈尼族等,可以按所属民族对人口哈尼族等,可以按所属民族对人口进行分组进行分组定序尺度(顺序尺度)定序尺度(顺序尺度)1.对事物分类的同时给出各类别的顺序对事物分类的同
7、时给出各类别的顺序2.比定类尺度精确比定类尺度精确3.未测量出类别之间的准确差值未测量出类别之间的准确差值4.各类之间是有序的,可以比较优劣各类之间是有序的,可以比较优劣5.具有具有或或的数学特性的数学特性定距尺度(间隔尺度)定距尺度(间隔尺度)1.对事物的准确测度对事物的准确测度2.比定序尺度精确比定序尺度精确3.数据表现为数据表现为“数值数值”4.没有绝对零点没有绝对零点5.具有具有+或或-的数学特性的数学特性例如,每一度的温差都是相同的,为例如,每一度的温差都是相同的,为1 1度;百度;百分制考试成绩,分值之间的间隔一般为分制考试成绩,分值之间的间隔一般为1010分,分,即即607060
8、70分为一档,分为一档,70807080分为一档,分为一档,80908090分分为一档;在进行收入调查时,也可以把调查者为一档;在进行收入调查时,也可以把调查者按一定收入差异分为不同的组,如按一定收入差异分为不同的组,如1000200010002000元的为较低收入者,元的为较低收入者,3000500030005000元的为中等收元的为中等收入者等。入者等。定比尺度(比率尺度)定比尺度(比率尺度)1.对事物的准确测度对事物的准确测度2.与定距尺度处于同一层次与定距尺度处于同一层次3.数据表现为数据表现为“数值数值”4.有绝对零点有绝对零点5.具有具有 或或 的数学特性的数学特性在定距尺度中,在
9、定距尺度中,“0”0”表示某一个数值,而定表示某一个数值,而定比尺度中,比尺度中,“0”0”表示表示“没有没有”或或“无无”。例。例如,温度是典型的定距尺度,因为在摄氏温度如,温度是典型的定距尺度,因为在摄氏温度中,中,00表示在海平面高度上水结冰的温度;表示在海平面高度上水结冰的温度;但对于销售人员来说,但对于销售人员来说,“0”0”表示没有成交量,表示没有成交量,所以销量属于定比尺度。所以销量属于定比尺度。1.3 统计中的几个基本概念统计中的几个基本概念1.3.1 总体和样本总体和样本总总体体(population)包含所研究的全部个包含所研究的全部个体(数据)的集合体(数据)的集合如:检
10、验一批灯泡的如:检验一批灯泡的使用寿命,这批灯泡使用寿命,这批灯泡寿命构成的集合就是寿命构成的集合就是总体总体根据范围是否确定和根据范围是否确定和所包含的单位数目是所包含的单位数目是否可数可以分为有限否可数可以分为有限总体和无限总体总体和无限总体如:一批待检验的灯如:一批待检验的灯泡的寿命是有限总体,泡的寿命是有限总体,由实验数据构成的总由实验数据构成的总体是无限总体体是无限总体通常情况下,统计通常情况下,统计上的总体是一组观上的总体是一组观测数据测数据 ,而不是,而不是一群人或一些物品一群人或一些物品的集合的集合如:可以把灯泡的如:可以把灯泡的寿命集合作为总体寿命集合作为总体 从总体中抽取的
11、一部分元素的集合从总体中抽取的一部分元素的集合 构成样本的元素的数目称为样本容构成样本的元素的数目称为样本容量或样本量量或样本量(sample size)样本样本(sample)样样本本抽取抽取总体总体推断推断抽样的目的是根据样本提供的信息抽样的目的是根据样本提供的信息推断总体的特征。推断总体的特征。1.3.2 参数和统计量参数和统计量1.参数参数(parameter)描述总体特征的概括性数字度量,是描述总体特征的概括性数字度量,是研究者想要研究者想要了解的总体的某种特征值了解的总体的某种特征值所关心的参数主要有总体均值所关心的参数主要有总体均值()、标准差、标准差()、总体比例总体比例()等
12、等总体参数通常用希腊字母表示总体参数通常用希腊字母表示 2.统计量统计量(statistic)用来描述样本特征的概括性数字度量,它是根据用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数样本数据计算出来的一些量,是样本的函数所关心的样本统计量有样本均值所关心的样本统计量有样本均值(x)、样本标准、样本标准差差(s)、样本比例、样本比例(p)等等样本统计量通常用小写英文字母来表示样本统计量通常用小写英文字母来表示 平均数平均数标准差标准差比比 例例参数参数统计量统计量总体总体样本样本用样本统计量去估计总体参数用样本统计量去估计总体参数1.3.3 变量变量(varia
13、ble)1.说明现象某种特征的概念说明现象某种特征的概念如商品销售额、受教育程度、产品的质量等级等如商品销售额、受教育程度、产品的质量等级等变量的具体表现称为变量值,即数据变量的具体表现称为变量值,即数据2.变量可以分为变量可以分为分类变量分类变量(categorical variable):说明事物类别的名称说明事物类别的名称顺序变量顺序变量(rank variable):说明事物有序类别的名称说明事物有序类别的名称数值型变量数值型变量(metric variable):说明事物数字特征的名说明事物数字特征的名称称 离散变量:取有限个值离散变量:取有限个值 连续变量:可以取无穷多个值连续变量
14、:可以取无穷多个值 变量类型变量类型 分类变量分类变量 顺序变量顺序变量数值型变量数值型变量 说明事物类别,取值是分类数据说明事物类别,取值是分类数据如:性别,变量值为如:性别,变量值为“男男”、“女女”行业,变量值为行业,变量值为“零售业零售业”、“旅游业旅游业”等等 说明事物有序类别,取值是顺序数据说明事物有序类别,取值是顺序数据如:产品等级,变量值为如:产品等级,变量值为“一等品一等品”、“二等品二等品”等等 受教育程度,变量值为受教育程度,变量值为“小学小学”、“中学中学”等等 说明事物数字特征,取值是数值型数据说明事物数字特征,取值是数值型数据又分为离散型变量和连续型变量又分为离散型
15、变量和连续型变量如:企业数量,温度,长度,金额等如:企业数量,温度,长度,金额等变变 量量(其他分类其他分类)1.随机变量和非随机变量随机变量和非随机变量2.经验变量经验变量(empirical variables)和理论变量和理论变量(theoretical variables)经验变量所描述的是我们周围可以观察到的事经验变量所描述的是我们周围可以观察到的事物物 理论变量则是由统计学家用数学方法所构造出理论变量则是由统计学家用数学方法所构造出来的一些变量,比如,来的一些变量,比如,z 统计量、统计量、t 统计量、统计量、2统计量、统计量、F 统计量等统计量等变量及其类型变量及其类型本章小节本章小节1.统计及其应用领域统计及其应用领域2.统计数据的类型统计数据的类型3.统计中的几个基本概念统计中的几个基本概念