总体与样本直方图、条形图及经验分布函数课件.ppt

上传人(卖家):晟晟文业 文档编号:5201542 上传时间:2023-02-16 格式:PPT 页数:45 大小:338KB
下载 相关 举报
总体与样本直方图、条形图及经验分布函数课件.ppt_第1页
第1页 / 共45页
总体与样本直方图、条形图及经验分布函数课件.ppt_第2页
第2页 / 共45页
总体与样本直方图、条形图及经验分布函数课件.ppt_第3页
第3页 / 共45页
总体与样本直方图、条形图及经验分布函数课件.ppt_第4页
第4页 / 共45页
总体与样本直方图、条形图及经验分布函数课件.ppt_第5页
第5页 / 共45页
点击查看更多>>
资源描述

1、1概率论与数理统计与数理统计 前几章我们学习了概率论的基本知识,从本前几章我们学习了概率论的基本知识,从本章开始将学习数理统计的基本知识、理论和方章开始将学习数理统计的基本知识、理论和方法数理统计是以对随机现象观测所取得的资料法数理统计是以对随机现象观测所取得的资料(数据)为出发点,以概率论为基础来研究随机(数据)为出发点,以概率论为基础来研究随机现象的一门学科现象的一门学科 概率论中,往往是在已知随机变量分布的条件概率论中,往往是在已知随机变量分布的条件下,去研究它的性质、特点和规律性,比如求随下,去研究它的性质、特点和规律性,比如求随机变量取某些特定值的概率、求随机变量的数字机变量取某些特

2、定值的概率、求随机变量的数字特征、研究多个随机变量之间的关系等特征、研究多个随机变量之间的关系等第第6章章 数理统计基础数理统计基础 在数理统计中,我们所研究的随机变量的分布在数理统计中,我们所研究的随机变量的分布往往是未知的,通过对随机变量进行多次独立重往往是未知的,通过对随机变量进行多次独立重复的试验和观测,获取数据,利用实际观测数据复的试验和观测,获取数据,利用实际观测数据研究随机变量的分布,对其分布函数、数字特征研究随机变量的分布,对其分布函数、数字特征等进行估计和推断等进行估计和推断 本章作为数理统计基础,学习总体、样本、统本章作为数理统计基础,学习总体、样本、统计量与抽样分布等有关

3、概念,以及有关正态总体计量与抽样分布等有关概念,以及有关正态总体的重要的抽样分布定理的重要的抽样分布定理 数理统计学是一门应用性很强的学科。它研数理统计学是一门应用性很强的学科。它研究怎样以有效的方式收集、究怎样以有效的方式收集、整理和分析带有随机整理和分析带有随机性的数据,以便对所考察的问题作出正确的推断性的数据,以便对所考察的问题作出正确的推断和预测,为采取正确的决策和行动提供依据和建和预测,为采取正确的决策和行动提供依据和建议。议。数理统计不同于一般的资料统计,它更侧数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资料的收重于应用随机现象本身的规律性进行资料的收集、整

4、理和分析。集、整理和分析。第第6章章 数理统计基础数理统计基础【数理统计简史数理统计简史】相对于其它许多数学分支而言,数理统计是相对于其它许多数学分支而言,数理统计是一个比较年轻的数学分支多数人认为一个比较年轻的数学分支多数人认为20世纪世纪40年代克拉美(年代克拉美(H.Carmer)的著作)的著作统计学的数学统计学的数学方法方法,使得,使得1945年以前年以前25年间英、美统计学家年间英、美统计学家在统计学方面的工作与法、俄数学家在概率论方在统计学方面的工作与法、俄数学家在概率论方面的工作结合起来,从而形成数理统计这门学面的工作结合起来,从而形成数理统计这门学科数理统计有很多分支,但其基本

5、内容为采集科数理统计有很多分支,但其基本内容为采集样本和统计推断两大部分发展到今天的现代数样本和统计推断两大部分发展到今天的现代数理统计学,已经历了各种历史变迁理统计学,已经历了各种历史变迁 1.近代统计学时期近代统计学时期 18世纪末到世纪末到19世纪,是近代统计学时期这一世纪,是近代统计学时期这一时期的重大成就是大数定律和概率论被引入统计时期的重大成就是大数定律和概率论被引入统计学之后最小二乘法、误差理论和正态分布理论学之后最小二乘法、误差理论和正态分布理论等相继成为统计学的重要内容这一时期有两大等相继成为统计学的重要内容这一时期有两大学派:数理统计学派和社会统计学派学派:数理统计学派和社

6、会统计学派【数理统计简史数理统计简史】【数理统计简史数理统计简史】数理统计学派始于数理统计学派始于19世纪中叶,代表人物是世纪中叶,代表人物是比利时的凯特莱(比利时的凯特莱(A.Quetelet,1796-1874),著),著有有概率论书简概率论书简社会物理学社会物理学等,他主张用等,他主张用研究自然科学的方法研究社会现象,正式把概率研究自然科学的方法研究社会现象,正式把概率论引入统计学,并最先用大数定律证明了社会生论引入统计学,并最先用大数定律证明了社会生活中随机现象的规律性,提出了误差理论凯特活中随机现象的规律性,提出了误差理论凯特莱的贡献,使统计学的发展进入个了一个新的阶莱的贡献,使统计

7、学的发展进入个了一个新的阶段段 社会统计学派始于社会统计学派始于19世纪末,首创人物是德国世纪末,首创人物是德国的克尼斯(的克尼斯(K.G.A.Knies),他认为统计学是一),他认为统计学是一个社会科学,是研究社会现象变动原因和规律性个社会科学,是研究社会现象变动原因和规律性的实质性科学各国专家学者在社会经济统计指的实质性科学各国专家学者在社会经济统计指标的设定与计算、指数的编制、统计调查的组织标的设定与计算、指数的编制、统计调查的组织和实施、经济社会发展评价和预测等方面取得了和实施、经济社会发展评价和预测等方面取得了一 系 列 的 重 要 成 果 德 国 统 计 学 家 恩 格 尔一 系

8、列 的 重 要 成 果 德 国 统 计 学 家 恩 格 尔(C.L.E.Engel,1821-1896)提出的)提出的“恩格尔恩格尔”系系数,美国经济学家库兹涅茨和英国经济学家斯通数,美国经济学家库兹涅茨和英国经济学家斯通等人研究的国民收入和国内生产总值的核算方法等人研究的国民收入和国内生产总值的核算方法等,都是伟大的贡献等,都是伟大的贡献【数理统计简史数理统计简史】18世纪到世纪到19世纪初期,高斯从描述天文观测的世纪初期,高斯从描述天文观测的误差而引进正态分布,并使用最小二乘法作为估误差而引进正态分布,并使用最小二乘法作为估计方法,是近代数理统计学发展初期的重大事件,计方法,是近代数理统计

9、学发展初期的重大事件,对社会发展有很大的影响对社会发展有很大的影响【数理统计简史数理统计简史】用正态分布描述观测数据的应用是如此普遍,以用正态分布描述观测数据的应用是如此普遍,以至 在至 在 1 9 世 纪 相 当 长 的 时 期 内,包 括 高 尔 顿世 纪 相 当 长 的 时 期 内,包 括 高 尔 顿(Galton)在内的一些学者,认为这个分布可用)在内的一些学者,认为这个分布可用于描述几乎是一切常见的数据直到现在,有关于描述几乎是一切常见的数据直到现在,有关正态分布的统计方法,仍占据着常用统计方法中正态分布的统计方法,仍占据着常用统计方法中很重要的一部分最小二乘法方面的工作,在很重要的

10、一部分最小二乘法方面的工作,在20世纪初以来,经过一些学者的发展,如今成了数世纪初以来,经过一些学者的发展,如今成了数理统计学中的主要方法理统计学中的主要方法【数理统计简史数理统计简史】2.现代统计学时期现代统计学时期 从从19世纪末到现在,是现代统计学时期这一世纪末到现在,是现代统计学时期这一时期的显著特点是数理统计学由于同自然科学、时期的显著特点是数理统计学由于同自然科学、工程技术科学紧密结合并被广泛应用于各个领域工程技术科学紧密结合并被广泛应用于各个领域而获得迅速发展各种新的统计理论和方法、尤而获得迅速发展各种新的统计理论和方法、尤其是推断统计理论与方法得以大量涌现其是推断统计理论与方法

11、得以大量涌现【数理统计简史数理统计简史】例如英国统计学家卡尔例如英国统计学家卡尔.皮尔逊(皮尔逊(K.Pearson,1857-1936)的)的 2分布理论,统计学家戈赛特分布理论,统计学家戈赛特(W.S.Gosset,1876-1937)的小样本)的小样本t分布理论,分布理论,统计学家费歇尔(统计学家费歇尔(R.A.Fisher,1890-1962)的)的F分分布理论和试验设计方法,波兰统计学家尼曼布理论和试验设计方法,波兰统计学家尼曼(J.N e y m a n)和 英 国 统 计 学 家 皮 尔 逊)和 英 国 统 计 学 家 皮 尔 逊(E.S.Pearson,1895-1980)的置

12、信区间理论和假)的置信区间理论和假设检验理论,以及非参数统计法、序贯抽样法、设检验理论,以及非参数统计法、序贯抽样法、多元统计分析法、时间序列跟踪预测法都应运而多元统计分析法、时间序列跟踪预测法都应运而生,并逐步成为现代统计学的主要内容生,并逐步成为现代统计学的主要内容【数理统计简史数理统计简史】现代统计学时期是数理统计发展的辉煌时期,现代统计学时期是数理统计发展的辉煌时期,数理统计不仅在理论上取得重大进展,其方法在数理统计不仅在理论上取得重大进展,其方法在生物、农业、医学、社会、经济、工业和科技等生物、农业、医学、社会、经济、工业和科技等方面得到愈来愈广泛的应用另外,计算机的应方面得到愈来愈

13、广泛的应用另外,计算机的应用对统计学的产生了巨大的影响,需要大量计算用对统计学的产生了巨大的影响,需要大量计算的统计方法,有了计算机,这一切都不成问题的统计方法,有了计算机,这一切都不成问题【数理统计简史数理统计简史】第第6章章 数理统计基础数理统计基础 【质量控制问题质量控制问题】某食盐厂用包装机包装的食盐,每袋重量某食盐厂用包装机包装的食盐,每袋重量500g,通常在包装机正常的情况下,袋装食盐的重量通常在包装机正常的情况下,袋装食盐的重量X服服从正态分布,均值为从正态分布,均值为500g,标准差为,标准差为25g为进行为进行生产质量控制,他们每天从当天的产品中随机抽生产质量控制,他们每天从

14、当天的产品中随机抽出出30袋进行严格称重,以检验包装机工作是否正袋进行严格称重,以检验包装机工作是否正常某日,该厂随机抽取常某日,该厂随机抽取30袋盐的重量分别为:袋盐的重量分别为:从这些数据看,包装机的工作正常吗?从这些数据看,包装机的工作正常吗?4754755005004854854544545045044394394924925015014634634614614644644944945125124514514344345115115135134904905215215145144494494674674994994844845085084784784794794994995295294

15、80480 6.1 总体和样本总体和样本6.1.1 6.1.1 总体与个体总体与个体 总体总体或或母体母体指我们研究对象的指我们研究对象的全体构成的集合全体构成的集合,个体个体指总体中包含的指总体中包含的每个成员每个成员 例如,在研究某高校学生生活消费状况时,例如,在研究某高校学生生活消费状况时,该校全体学生就是一个总体,其中每一个学生是该校全体学生就是一个总体,其中每一个学生是一个个体;在人口普查中,总体是某地区的全体一个个体;在人口普查中,总体是某地区的全体人口,个体就是该地区的每一个人人口,个体就是该地区的每一个人第第6章章 数理统计基础数理统计基础6.1.1 6.1.1 总体与个体总体

16、与个体 我们研究总体时,所关心的往往是总体某方我们研究总体时,所关心的往往是总体某方面的特性,这些特性又常常可以用一个或多个数面的特性,这些特性又常常可以用一个或多个数量指标来反映量指标来反映 例如,在研究某高校学生生活消费状况时,例如,在研究某高校学生生活消费状况时,关心的可能是学生们每月的生活消费额,在研究关心的可能是学生们每月的生活消费额,在研究某厂生产的灯泡的质量时,关心的可能是这些灯某厂生产的灯泡的质量时,关心的可能是这些灯泡的寿命和光亮度等泡的寿命和光亮度等 这时这时总体指一个或多个数量指标,总体指一个或多个数量指标,这些数量指这些数量指标对我们来说是不了解或者说是未知的,标对我们

17、来说是不了解或者说是未知的,我们可我们可以用一个或多个随机变量来表示它们以用一个或多个随机变量来表示它们 因此,总体可以是一维随机变量,也可以是多因此,总体可以是一维随机变量,也可以是多维随机变量维随机变量 例如,在研究某高校学生生活消费状况时,可例如,在研究某高校学生生活消费状况时,可以用以用X表示月生活消费额,在研究某厂生产的灯泡表示月生活消费额,在研究某厂生产的灯泡的质量时,可以分别用的质量时,可以分别用X,Y表示灯泡的寿命和光表示灯泡的寿命和光亮度,那么,对上面两个问题的研究就转化为对亮度,那么,对上面两个问题的研究就转化为对总体总体X和总体和总体(X,Y)的研究了的研究了 6.1.1

18、 6.1.1 总体与个体总体与个体 根据总体中包含个体的数量,可以将总体分根据总体中包含个体的数量,可以将总体分为为有限总体有限总体和和无限总体无限总体,当总体中包含个体的数,当总体中包含个体的数量很大时,我们可以把有限总体看成是无限总量很大时,我们可以把有限总体看成是无限总体体 例如,某厂某天生产的灯泡可以看作是有限总例如,某厂某天生产的灯泡可以看作是有限总体,而该厂生产的全部灯泡就可以看作为无限总体,而该厂生产的全部灯泡就可以看作为无限总体,因为它包含过去和将来生产的灯泡的全部体,因为它包含过去和将来生产的灯泡的全部6.1.1 6.1.1 总体与个体总体与个体6.1.2 6.1.2 样本与

19、抽样样本与抽样 实际应用中,为了研究总体的特性,总是从实际应用中,为了研究总体的特性,总是从总体中抽出部分个体进行观察和试验,根据观察总体中抽出部分个体进行观察和试验,根据观察或试验得到的数据推断总体的性质或试验得到的数据推断总体的性质我们把从总体中抽出的部分个体称为我们把从总体中抽出的部分个体称为样本样本,把样本中包含个体的数量称为把样本中包含个体的数量称为样本容量样本容量,把对样本的观察或试验的过程称为把对样本的观察或试验的过程称为抽样抽样,把观察或试验得到的数据称为把观察或试验得到的数据称为样本观测值样本观测值(观测(观测数据),简称数据),简称样本值样本值 例如,在质量检验中,随机抽出

20、例如,在质量检验中,随机抽出n件产品,测件产品,测得的数据得的数据x1,x2,.,xn,就称它们是,就称它们是样本观测样本观测值值 在抽样前,不知道样本观测值究竟取何值,应在抽样前,不知道样本观测值究竟取何值,应该把它们看作为随机变量,记作该把它们看作为随机变量,记作X1,X2,.,Xn,称其为称其为容量为容量为n的的样本样本.(在不会混淆的情况下,有时我们也将观测数据(在不会混淆的情况下,有时我们也将观测数据x1,x2,.,xn称为样本,如称为样本,如“质量控制问题质量控制问题”中中的的30个数据,也可以说成是一个容量为个数据,也可以说成是一个容量为30的样的样本)本)6.1.26.1.2

21、样本与抽样样本与抽样 在应用中,我们从总体中抽出的个体必须具有代在应用中,我们从总体中抽出的个体必须具有代表性,样本中个体之间要具有相互独立性,为保证表性,样本中个体之间要具有相互独立性,为保证这两点,一般采用简单随机抽样这两点,一般采用简单随机抽样 定义定义6.1 一种抽样方法若满足下面两点,称其为一种抽样方法若满足下面两点,称其为简单随机抽样简单随机抽样:(1)总体中每个个体被抽到的机会是均等的;总体中每个个体被抽到的机会是均等的;(2)样本中的个体相互独立样本中的个体相互独立 由简单随机抽样得到的样本称为由简单随机抽样得到的样本称为简单随机样本简单随机样本 如果没有特殊说明如果没有特殊说

22、明,以后所说样本均指简单随机样以后所说样本均指简单随机样本本6.1.26.1.2 样本与抽样样本与抽样 设设X1,X2,.,Xn是从总体是从总体X中抽出的简单随机样中抽出的简单随机样本,由定义可知,本,由定义可知,X1,X2,.,Xn有下面两个特性:有下面两个特性:(1)代表性:代表性:X1,X2,.,Xn均与均与X同分布,即若同分布,即若X F(x),则对每一个,则对每一个Xi都有都有Xi F(xi),i=1,2,n (2)独立性:独立性:X1,X2,.,Xn相互独立相互独立.由这两个特性可知,若由这两个特性可知,若X的分布函数为的分布函数为F(x),则,则X1,X2,.,Xn的联合分布函数

23、为的联合分布函数为 F(x1,x2,xn)=F(x1)F(x2)F(xn)若若X具有概率密度为具有概率密度为f(x),则,则X1,X2,.,Xn的联合概的联合概率密度为率密度为 f(x1,x2,xn)=f(x1)f(x2)f(xn)6.1.26.1.2 样本与抽样样本与抽样往往是未知或不完往往是未知或不完全知道的,是需要全知道的,是需要通过样本来进行研通过样本来进行研究和推断的究和推断的【例例6.1】设总体设总体X服从均值为服从均值为1/2的指数分布,的指数分布,X1,X2,X3,X4为来自为来自X的样本,求的样本,求X1,X2,X3,X4的的联合概率密度和联合分布函数联合概率密度和联合分布函

24、数 解:解:X的概率密度为的概率密度为其分布函数为其分布函数为则则X1,X2,X3,X4的联合概率密度为:的联合概率密度为:6.1.26.1.2 样本与抽样样本与抽样 0,00,2)(2xxexfx 0,00,1)(2xxexFx)()()()(),(43214321xfxfxfxfxxxxf 其它其它,04,3,2,1,0,16412ixeixii6.1.26.1.2 样本与抽样样本与抽样由于由于X的分布函数为的分布函数为X1,X2,X3,X4的联合分布函数为的联合分布函数为 )()()()(),(43214321xFxFxFxFxxxxF 其它其它,04,3,2,1,0)1(412ixei

25、ixi 0,00,1)(2xxexFx【例例6.2】已知总体已知总体X的分布为的分布为PX=i=1/4,i=0,1,2,3,抽取抽取n=36的简单随机样本的简单随机样本X1,X2,.,X36,求求 大于大于50.4小于小于64.8的概率的概率 解:解:总体总体X的均值和方差分别为的均值和方差分别为 6.1.26.1.2 样本与抽样样本与抽样22)()()(XEXEXD 361iiXY23)3210(41)(XE2222223)3210(41 45 由于由于X1,X2,.,X36均与总体均与总体X同分布,且相互独同分布,且相互独立,所以,立,所以,Y的均值和方差分别为的均值和方差分别为 又因为又

26、因为n=36较大,依中心极限定理,较大,依中心极限定理,近似近似服从正态分布服从正态分布 ,所以,所以 6.1.26.1.2 样本与抽样样本与抽样,54)(36)()(361 XEXEYEii454536)(36)()(361 XDXDYDii 361iiXY)45,54(N8.644.50 YP)54.0()61.1(45548.64455445544.50YP6517.07054.019463.0 6.1 6.1 总体和样本总体和样本 6.1.3 6.1.3 直方图与经验分布函数直方图与经验分布函数 如前所述,数理统计所研究的实际问题(总体)如前所述,数理统计所研究的实际问题(总体)的分布

27、一般来说是未知的,需要通过样本来推的分布一般来说是未知的,需要通过样本来推断但如果对总体一无所知,那么,做出推断的断但如果对总体一无所知,那么,做出推断的可信度一般也极为有限在很多情况下,我们往可信度一般也极为有限在很多情况下,我们往往可以通过具体的应用背景或以往的经验,再通往可以通过具体的应用背景或以往的经验,再通过观察样本观测值的分布情况,对总体的分布形过观察样本观测值的分布情况,对总体的分布形式有个大致了解观察样本观测值的分布规律,式有个大致了解观察样本观测值的分布规律,了解总体了解总体X的概率密度和分布函数,常用直方图的概率密度和分布函数,常用直方图和经验分布函数和经验分布函数.1.直

28、方图直方图 直方图是对一组数据直方图是对一组数据x1,x2,.,xn的分布情况的分布情况的图形描述的图形描述 将数据的取值范围分成若干区间(一般是等将数据的取值范围分成若干区间(一般是等间隔的),在等间隔的情况,每个区间的长度称间隔的),在等间隔的情况,每个区间的长度称为组距考察这些数据落入每一个小区间的频数为组距考察这些数据落入每一个小区间的频数和频率,在每一个区间上画一个矩形,它的宽度和频率,在每一个区间上画一个矩形,它的宽度是组距,高度可以是频数、频率是组距,高度可以是频数、频率或频率或频率/组距,所得直方图分组距,所得直方图分别称为别称为频数直方图频数直方图、频率直频率直方图方图和和密

29、度直方图密度直方图6.1.3 6.1.3 直方图与经验分布函数直方图与经验分布函数图图6-1 密度直方图密度直方图如果数据如果数据x1,x2,.,xn是来自连续总体是来自连续总体X的样本的样本观测值,其密度直方图中,每一个矩形的面积恰观测值,其密度直方图中,每一个矩形的面积恰好是观测数据落入对应区间的频率,这种密度直好是观测数据落入对应区间的频率,这种密度直方图可以用来估计总体的概率密度(用密度直方方图可以用来估计总体的概率密度(用密度直方图的顶部折线估计图的顶部折线估计X的概率密度曲线)组距对直的概率密度曲线)组距对直方图的形态有很大的影响,组距太小或太大,直方图的形态有很大的影响,组距太小

30、或太大,直方图反映概率密度的形态就不够准确方图反映概率密度的形态就不够准确6.1.36.1.3 直方图与经验分布函数直方图与经验分布函数6.1.36.1.3 直方图与经验分布函数直方图与经验分布函数 一个合适的分组是希望密度直方图的形态接一个合适的分组是希望密度直方图的形态接近总体的概率密度函数的形态手工计算常取近总体的概率密度函数的形态手工计算常取组数等于组数等于 左右,一些统计软件会根据样本容左右,一些统计软件会根据样本容量和样本的取值范围自动确定一个合适的分组量和样本的取值范围自动确定一个合适的分组方式,画出各种漂亮的直方图方式,画出各种漂亮的直方图n【实验实验6-1】从某高校一年学生的

31、从某高校一年学生的“高等数学高等数学”课课程考试成绩中,随机抽取程考试成绩中,随机抽取60名学生的成绩如下:名学生的成绩如下:试利用试利用Excel的的“数据分析数据分析”功能作学生成绩的密功能作学生成绩的密度直方图,并通过直方图了解学生成绩的分布情度直方图,并通过直方图了解学生成绩的分布情况况7669717769718369858586777495668766516873776266739379638787548057727258767276697181756674606779638878857258906170776880796.1.3 直方图与经验分布函数直方图与经验分布函数 实验步骤实

32、验步骤:(1)确定分组个数:因为确定分组个数:因为 ,取分组个数为,取分组个数为8数据的最小值为数据的最小值为51,最大值为,最大值为95,为分组方便,为分组方便起见,考虑范围从起见,考虑范围从50到到100,分为,分为8个组,组距取个组,组距取50/8=6.25,分点分别为:,分点分别为:50,56.25,62.5,68.75,75,81.25,87.5,93.75,100。整理学生。整理学生成绩数据,在成绩数据,在“组上限组上限”栏中填入各组的上限值,栏中填入各组的上限值,如图如图6-2左所示左所示75.760 图图6-2 数据整理与数据整理与“直方图直方图”对话框对话框 (2)在在Exc

33、el主菜单中选择主菜单中选择“工具工具”“数据分析数据分析”,打开打开“数据分析数据分析”对话框,在对话框,在“分析工具分析工具”列表中列表中选择选择“直方图直方图”选项,单击选项,单击“确定确定”按钮按钮 (3)在打开的在打开的“直方图直方图”对话框中,依次输入(或对话框中,依次输入(或用鼠标拖动选择)用鼠标拖动选择)“输入区域输入区域”、“接收区域接收区域”和和“输出区域输出区域”,如图,如图6-2右所示,单击右所示,单击“确定确定”按按钮钮得到频率分布的结果如图得到频率分布的结果如图6-3左所示左所示 图图6-3 计算各组频率与密度计算各组频率与密度 (4)计算密度:在单元格区域计算密度

34、:在单元格区域J2:J9中依次输入组中依次输入组域名:域名:50-56.25、56.25-62.5、62.5-68.75、68.75-75、75-81.25、81.25-87.5、87.5-93.75、93.75-100,然后,然后在在“密度密度”列的单元格列的单元格K2中输入公式:中输入公式:=I2/60/6.25,并将公式复制到并将公式复制到K3K9中,如图中,如图6-3右所示右所示 (5)画密度直方图:选中单元格区域画密度直方图:选中单元格区域J1:K9,单击,单击“图表向导图表向导”按钮,打开按钮,打开“图表向导图表向导”对话框在对话框在“图表类型图表类型”选择中,取默认的选择中,取默

35、认的“柱形图柱形图”向导,向导,直接单击直接单击“完成完成”按钮,即可得到密度柱形图,如按钮,即可得到密度柱形图,如图图6-4所示所示图图6-4 密度柱形图密度柱形图 右键单击图中条形,在快捷菜单中选择右键单击图中条形,在快捷菜单中选择“数据系数据系列格式列格式”,打开,打开“数据系列格式数据系列格式”对话框,在其中对话框,在其中的的“选项选项”选项卡中,修改选项卡中,修改“分类间距分类间距”为为0,如图,如图6-5(左)所示,单击(左)所示,单击“确定确定”按钮,即可加宽条形,按钮,即可加宽条形,得到密度直方图,进一步修改图形,得到密度直方得到密度直方图,进一步修改图形,得到密度直方图,如图

36、图,如图6-5(右)所示(右)所示 图图6-5 密度直方图密度直方图从学生成绩的密度直方图可以看到,学生成绩在平从学生成绩的密度直方图可以看到,学生成绩在平均分附近比较密集,较低或较高分数学生比较少,均分附近比较密集,较低或较高分数学生比较少,学生成绩的分布呈近似学生成绩的分布呈近似“钟形钟形”对称,即成绩分布对称,即成绩分布近似正态分布近似正态分布类似的方法可以画出学生成绩的频数直方图和频率类似的方法可以画出学生成绩的频数直方图和频率直方图,由于三种直方图只是高度相差一定的倍数,直方图,由于三种直方图只是高度相差一定的倍数,所以在研究总体分布的形态时,三种直方图具有同所以在研究总体分布的形态

37、时,三种直方图具有同样的作用样的作用 分布函数是随机变量的一个重要特征,既然总体可以用分布函数是随机变量的一个重要特征,既然总体可以用随机变量来表示,而样本又可对总体的信息进行提取。因此,随机变量来表示,而样本又可对总体的信息进行提取。因此,怎样用样本怎样用样本(X1,Xn)估计总体估计总体X的分布函数的分布函数F(x)?任意给定自变量任意给定自变量x,则,则 F(x)=P(Xx)用事件用事件Xx)发生的频率作为其估计即可。这就引出了下面发生的频率作为其估计即可。这就引出了下面所谓经验分布函数的概念。所谓经验分布函数的概念。6.1.36.1.3 直方图与经验分布函数直方图与经验分布函数().n

38、xF xx Rn 样本中小于的观测值的个数,2.经验分布函数经验分布函数 为了解总体为了解总体X的分布形式,根据样本观测值的分布形式,根据样本观测值x1,x2,.,xn构造一个函数构造一个函数Fn(x)来近似总体来近似总体X的分布的分布函数,函数函数,函数Fn(x)称为称为经验分布函数经验分布函数它的构造方它的构造方法是这样的,将样本观测值法是这样的,将样本观测值x1,x2,.,xn按从小按从小到大可排成到大可排成 ,定义,定义 6.1.36.1.3 直方图与经验分布函数直方图与经验分布函数)()2()1(nxxx )()1()()1(,11,2,1,0)(nkknxxnkxxxnkxxxFF

39、n(x)只在只在x=x(k),(,(k=1,2,n)处有跃度为)处有跃度为1/n的间断点,若有的间断点,若有l个观测值相同,则个观测值相同,则Fn(x)在此观在此观测值处的跃度为测值处的跃度为l/n对于固定的对于固定的x,Fn(x)即表示事即表示事件件X x在在n次试验中出现的频率,即次试验中出现的频率,即 ,其,其中中k为落在为落在(-,x)中中xi的个数的个数 6.1.36.1.3 直方图与经验分布函数直方图与经验分布函数)()2()1(nxxx )()1()()1(,11,2,1,0)(nkknxxnkxxxnkxxxFnkxFn)(例例 总体总体X,样本观察值,样本观察值1,2,2,2

40、,3,3,3,4,则经验分布函数为则经验分布函数为 80,1;1/8,12;()4/8,23;7/8 ,34;1,4;xxFxxxx经验分布函数如右图所示:经验分布函数如右图所示:由伯努利大数定理知由伯努利大数定理知Fn(x)依概率收敛于依概率收敛于F(x)实际上,实际上,Fn(x)还一致地收敛于还一致地收敛于F(x),所谓,所谓的格里文科定理指出了这一更深刻的结论,即的格里文科定理指出了这一更深刻的结论,即 所以,当所以,当n充分大时经验分布函数充分大时经验分布函数Fn(x)是总体分是总体分布函数布函数F(x)的一个良好的近似的一个良好的近似 6.1.36.1.3 直方图与经验分布函数直方图与经验分布函数10)()(suplim xFxFPnxn

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(总体与样本直方图、条形图及经验分布函数课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|