应用数理统计第一章)课件.ppt

上传人(卖家):晟晟文业 文档编号:5219130 上传时间:2023-02-17 格式:PPT 页数:61 大小:715.03KB
下载 相关 举报
应用数理统计第一章)课件.ppt_第1页
第1页 / 共61页
应用数理统计第一章)课件.ppt_第2页
第2页 / 共61页
应用数理统计第一章)课件.ppt_第3页
第3页 / 共61页
应用数理统计第一章)课件.ppt_第4页
第4页 / 共61页
应用数理统计第一章)课件.ppt_第5页
第5页 / 共61页
点击查看更多>>
资源描述

1、2022-11-26(C)中国民航大学 理学院 张春晓12022-11-262主讲教师主讲教师 张春晓张春晓 理学院理学院 副教授副教授 研究兴趣:统计预测与决策、优化与控制研究兴趣:统计预测与决策、优化与控制办公地点:理学院统计教研室(南办公地点:理学院统计教研室(南1-316)电话:电话:24092054 E-mail: 2022-11-263课程成绩课程成绩 考试成绩由期末考试成绩和平时考核成绩考试成绩由期末考试成绩和平时考核成绩两部分组成。平时成绩占两部分组成。平时成绩占15%15%;期末考试采用;期末考试采用闭卷(开卷)笔试方式进行,占闭卷(开卷)笔试方式进行,占85%85%。答疑时

2、间地点答疑时间地点 课后或周五下午统计教研室课后或周五下午统计教研室2022-11-264课程说明课程说明 教学目的教学目的 应用数理统计是一门科学,实证的方法,应用数理统计是一门科学,实证的方法,尤其是数量分析方法是统计学研究的基本方尤其是数量分析方法是统计学研究的基本方法论。通过该门课程教学,使学生掌握统计法论。通过该门课程教学,使学生掌握统计学的基本理论与方法,并能够建立实用的应学的基本理论与方法,并能够建立实用的应用统计模型,解决实际问题。用统计模型,解决实际问题。先修课程先修课程 微积分、线性代数、概率论与数理统计、微积分、线性代数、概率论与数理统计、数学软件、统计学原理数学软件、统

3、计学原理 。应用数理统计与经济理论、统计学和数学的应用数理统计与经济理论、统计学和数学的联系联系数学数学统计学统计学数理统计数理统计 管理学管理学工学工学其他学科其他学科2022-11-266学习方法学习方法 理论与应用并重。既要重视理论方法,也要重视理论与应用并重。既要重视理论方法,也要重视应用模型和应用中实际问题的解决;应用模型和应用中实际问题的解决;以教材中的经典理论方法为主,也要理解适当引以教材中的经典理论方法为主,也要理解适当引入的、教材中没有的非经典理论方法;入的、教材中没有的非经典理论方法;对于理论方法,重点是思路而不是数学过程;对于理论方法,重点是思路而不是数学过程;对于应用模

4、型,重点不是每种模型本身,而是它对于应用模型,重点不是每种模型本身,而是它们演变与发展的方法论;们演变与发展的方法论;必须十分重视综合练习;必须十分重视综合练习;必须掌握一种应用软件,注意课堂的软件应用演必须掌握一种应用软件,注意课堂的软件应用演示,示,“师傅领进门,修行在个人师傅领进门,修行在个人”,多练。,多练。2022-11-267n本课程:应用数理统计;本课程:应用数理统计;36学时;学时;n教材:吴翊等教材:吴翊等应用数理统计应用数理统计,国防科技大学,国防科技大学出版社,出版社,2003;n参考书:清华大学编参考书:清华大学编现代应用数学手册(数理现代应用数学手册(数理统计卷)统计

5、卷),科学出版社,科学出版社,2002。n统计软件:统计软件:EXCEL、SPSS、MATLAB(统计(统计分析工具箱)。分析工具箱)。n基础知识见附录基础知识见附录I,(以浙江大学,(以浙江大学概率论与数概率论与数理统计理统计为准)。为准)。2022-11-268能力培养能力培养n数据的产生:数据怎么得来,非常重要,这数据的产生:数据怎么得来,非常重要,这是统计当中影响最大的概念;是统计当中影响最大的概念;n资料分析:你会学到,即使用很简单的方法,资料分析:你会学到,即使用很简单的方法,也能很睿智地解读数据;也能很睿智地解读数据;n概率:利用概率进行思考,可以帮你把事实概率:利用概率进行思考

6、,可以帮你把事实和无关紧要的干扰信息分离;和无关紧要的干扰信息分离;n统计推断:让你学会用手中少量的数据,对统计推断:让你学会用手中少量的数据,对一个较大的总体做出结论。一个较大的总体做出结论。2022-11-269案例案例 许多统计学家在第二次世界大战中发挥了重许多统计学家在第二次世界大战中发挥了重大的作用,沃德是其中之一。他发明的一些统计大的作用,沃德是其中之一。他发明的一些统计方法,在战时被视为军事机密。沃德在被咨询飞方法,在战时被视为军事机密。沃德在被咨询飞机上什么部位的钢板需要加强时,画了飞机的轮机上什么部位的钢板需要加强时,画了飞机的轮廓,并且标出返航的战斗机上受敌军创伤的弹孔廓,

7、并且标出返航的战斗机上受敌军创伤的弹孔位置。资料积累了一段时间后,机身各部位几乎位置。资料积累了一段时间后,机身各部位几乎都被填满了。于是沃德建议,把剩下少数几个没都被填满了。于是沃德建议,把剩下少数几个没有弹孔的位置加强。有弹孔的位置加强。?因为这些部位被击中的飞机都没有返航因为这些部位被击中的飞机都没有返航。摘自摘自统计学的世界统计学的世界(美)戴维著。(美)戴维著。2022-11-2610第一章第一章 数理统计的基本概念数理统计的基本概念1.1 导言导言n什么是数理统计?什么是数理统计?统计统计:指数据的收集、整理和分析,由全部信指数据的收集、整理和分析,由全部信息(数据)得出正确的唯一

8、结果;息(数据)得出正确的唯一结果;数理统计数理统计:指有效地收集、整理和分析带有随指有效地收集、整理和分析带有随机性影响的数据,对所观测的部分信息推断合机性影响的数据,对所观测的部分信息推断合理的结果即进行理的结果即进行统计推断统计推断,直到为采取决策提直到为采取决策提供依据。供依据。n为什么要用数理统计?为什么要用数理统计?实际中,数据量大(抽取的数据具有随机实际中,数据量大(抽取的数据具有随机性),试验具有破坏性(不可重复)。性),试验具有破坏性(不可重复)。2022-11-2611n数理统计的研究范畴数理统计的研究范畴:应用广泛:应用广泛 传统上,有生物统计(遗传学、医药)、农业统计、

9、传统上,有生物统计(遗传学、医药)、农业统计、工业统计(民航统计)等;工业统计(民航统计)等;现代,多元统计应用领域:通信、质量控制、气象、现代,多元统计应用领域:通信、质量控制、气象、地质勘探、市场预测与决策等。地质勘探、市场预测与决策等。n数理统计的数理统计的基本内容基本内容:数据采集(抽样理论、试验设计:数据采集(抽样理论、试验设计等)与统计推断(估计、检验等)。等)与统计推断(估计、检验等)。n统计推断统计推断的结果往往有赖于方法,尽可能采用的结果往往有赖于方法,尽可能采用“有效的有效的”方法。方法。“有效的有效的”标准标准:样本尽可能少,而结果更合理,:样本尽可能少,而结果更合理,“

10、大量重复使用该方法总体效果好大量重复使用该方法总体效果好”基于概率论原理基于概率论原理。2022-11-26121.2 样本与总体样本与总体n样本样本:经观察或试验得到的数据经观察或试验得到的数据样本样本(子样);(子样);观察或试验的过程观察或试验的过程抽样抽样;“抽样调查抽样调查”:是一种观测研究,抽样的精髓是从:是一种观测研究,抽样的精髓是从检查一部分来得知全体。检查一部分来得知全体。“你不必吃完整头牛,才知道肉是老的你不必吃完整头牛,才知道肉是老的”西方谚语。西方谚语。2022-11-2613n经经n次试验得到次试验得到n个数据个数据样本容量样本容量为为n;n 一组数据,一个(容量为一

11、组数据,一个(容量为n的)的)样本(子样);样本(子样);n样本所有可能取值的集合样本所有可能取值的集合样本空间样本空间(n维空维空间的子集);间的子集);n数据可以是数据可以是数值数值或或属性属性(但要用数值表示);(但要用数值表示);n以一维数据以一维数据X或或Y为研究对象为研究对象一元统计一元统计;n以多维数据(以多维数据(X,Y)为研究对象为研究对象多元统计多元统计。n随机试验(产生样本)要求在相同条件下能够独随机试验(产生样本)要求在相同条件下能够独立重复地进行。立重复地进行。n样本是随机试验的结果。样本是随机试验的结果。nXXX,.,212022-11-2614(2)(2)样本样本

12、X1,X2,Xn具有二重性:具有二重性:可看成一个可看成一个n 维随机向维随机向量量,记为记为(X1,X2,Xn);作为样本值记为作为样本值记为(x1 1,x2 2,xn);(1)(1)样本样本X1,X2,Xn 相互独立相互独立,且与总体且与总体X 同分布同分布;(3)若总体若总体X具有分布函数具有分布函数F(x),概率密度概率密度f(x),则样本则样本 (X1,X2,Xn)的分布函数及概率密度为的分布函数及概率密度为:niinxFxxxF121)(),(niinxfxxxf121)(),(4)获得简单随机样本的抽样方法称为获得简单随机样本的抽样方法称为简单随机抽样简单随机抽样.2022-11

13、-2615【例例1.3】(P6)设一组抽奖劵共设一组抽奖劵共10000张,张,其中其中5张有奖。问连续抽取张有奖。问连续抽取3张有奖的概率张有奖的概率为多少?为多少?讨论:不放回抽样和放回抽样。讨论:不放回抽样和放回抽样。随机抽样方式:放回抽样随机抽样方式:放回抽样(要求样本独立)(要求样本独立)由由“随机抽样随机抽样”得到得到“简单样本简单样本”。由于由于 独立同分布,设该分布函数为独立同分布,设该分布函数为F(x),则,则样本联合分布函数为样本联合分布函数为:F(X1)F(X2)F(Xn);样本联合密度函数为:样本联合密度函数为:f(X1)f(X2)f(Xn)。nXXX,.,212022-

14、11-2616 总体总体n一般定义:所研究对象的全体的集合一般定义:所研究对象的全体的集合总体总体。集合的元素集合的元素个体个体。n总体和样本的区别是统计里很基本的概念;总体和样本的区别是统计里很基本的概念;n如,电视收视率调查如,电视收视率调查 总体:所有总体:所有5亿有电视机的中国住户;亿有电视机的中国住户;样本:约样本:约5000个住户,住户同意使用个住户,住户同意使用“个人电视个人电视记录器记录器”来记录该户中每个人收视的节目。所记来记录该户中每个人收视的节目。所记录的变量包括住户中的人数及其年龄、性别、收录的变量包括住户中的人数及其年龄、性别、收视时段、内容等。视时段、内容等。n普查

15、普查:企图把整个总体纳入样本的抽样调查。:企图把整个总体纳入样本的抽样调查。2022-11-2617n从数学上也可如此定义:从数学上也可如此定义:总体总体是指某个随机变量所有可能的取值的全是指某个随机变量所有可能的取值的全体,或就是一个随机变量体,或就是一个随机变量X,而,而样本样本即是与即是与X同同分布且相互独立的一组随机变量分布且相互独立的一组随机变量X1,X2,Xn。n【例例1.4】两台车床,各车出两台车床,各车出m,n件零件,尺件零件,尺寸分别为寸分别为X1,X2,Xm和和Y1,Y2,Yn,视作取自两,视作取自两个总体个总体X,Y的容量分别为的容量分别为m,n的样本。的样本。n统计推断

16、即由样本推断总体的性质,如上例中,统计推断即由样本推断总体的性质,如上例中,推断两台车床总体上是否有差异。推断两台车床总体上是否有差异。n总体的分布总体的分布统计模型,统计建模的目的即确统计模型,统计建模的目的即确定定X的分布、参数等。的分布、参数等。2022-11-26181.2.3 参数与参数空间参数与参数空间一般情况下总体分布未知,需要样本信息去推断。一般情况下总体分布未知,需要样本信息去推断。【例例1.5】(P8)考虑如何由样本)考虑如何由样本X1,X2,Xn的的实际背景确定统计模型,即总体实际背景确定统计模型,即总体X的分布函数:的分布函数:(1)样本记录随机抽取的)样本记录随机抽取

17、的n件产品的正品、废品件产品的正品、废品情况。情况。(2)样本表示同一批)样本表示同一批n个电子元件的寿命(小时)个电子元件的寿命(小时)(3)样本表示同一批)样本表示同一批n件产品某一尺寸(件产品某一尺寸(mm)2022-11-26191.2.3 参数与参数空间参数与参数空间当分布类型已知,其中参数未知,则由样本推断当分布类型已知,其中参数未知,则由样本推断参数(估计、检验)参数(估计、检验)。参数的所有可能取值的集合参数的所有可能取值的集合参数空间参数空间(视具体问题而定)(视具体问题而定)统计推断:包括统计推断:包括参数推断参数推断(分布类型已知)和(分布类型已知)和非非参数推断参数推断

18、(分布类型未知)两种。(分布类型未知)两种。2022-11-26201.3 直方图与经验分布函数直方图与经验分布函数1.3.1 直方图直方图n依据概率论的大数定理(附录依据概率论的大数定理(附录1 柯尔莫哥洛夫强大数定柯尔莫哥洛夫强大数定理):频率近似于概率。理):频率近似于概率。n当总体分布未知,要用样本对总体分布进行非参数推断,当总体分布未知,要用样本对总体分布进行非参数推断,n常用方法是直方图和经验分布函数。常用方法是直方图和经验分布函数。)()(),(11ndxxfttXPnnfjjttjjjj21n取取a略小于略小于 X(1),b略大于略大于X(n),将区间分成,将区间分成m个小区间

19、,个小区间,n记记 落入小区间落入小区间 中观察值的个数(频中观察值的个数(频 数),数),n计算频率计算频率 ;n在直角坐标系在直角坐标系xoy中画出以中画出以 为底,为底,为高的矩为高的矩形,即得到直方图,其对应的分段函数形,即得到直方图,其对应的分段函数n 用来近似概率密度函数用来近似概率密度函数f(x)bt.ttam20 jn,(1jjttnnfjj,(1jjttnnfjjmjttxtfxjjjjn,.,2,1,(,)(1直方图的具体做法直方图的具体做法n将所有样本由小到大排序,记为将所有样本由小到大排序,记为X(1),X(2),X(n)2022-11-26(C)中国民航学院 理学院

20、张春晓22【例例1.6】P10齿齿 轮轮 误误 差差42.02.02.01.5.52.521.01.03.584.04.07.563.03.010.5126.06.016.594.54.521.0105.05.026.0178.58.534.573.53.538.02412.012.050.0147.07.057.063.03.060.084.04.064.0105.05.069.073.53.572.5115.55.578.063.03.081.063.03.084.031.51.585.5199.59.595.021.01.096.01.5.596.51.5.597.031.51.598.

21、521.01.099.51.5.5100.0200100.0100.08910111213141516171819202122232425262728293031323338TotalValidFrequencyPercentValid PercentCumulativePercent2022-11-2623【例例1.6】(P10)齿轮的径向综合误差齿轮的径向综合误差 F i的直方图的直方图,(1jjtt,(1jjtt2022-11-2624直方图直方图 以概率以概率1成立成立.2022-11-26251.3.2 经验分布函数经验分布函数 设总体设总体X的分布函数未知,样本为的分布函数未知,样

22、本为X1,X2,Xnn 将样本从小到大排序(即求顺序统计量)得到将样本从小到大排序(即求顺序统计量)得到n定义:定义:经验分布函数经验分布函数为右连续,间断点处跃度为为右连续,间断点处跃度为1/n。以格里文科定理可以证明以格里文科定理可以证明,)()2()1(.nXXX)()1()()1(,11,.,2,1,0)(nkknXxnkXxXnkXxxF)()(xFxFn)()(sup,10limxFxFDDPnxnnn其中即2022-11-26(C)中国民航大学 理学院 张春晓26当当 时时,1)(xXPxF3x 0 X(1)X(2)X(3)X(n)Fn(x)1xF Fn n(x x)的图形的图形

23、为为2022-11-26(C)中国民航大学 理学院 张春晓27 1.4 统计量及其分布统计量及其分布n在利用样本推断总体的性质时,往往不能直接利在利用样本推断总体的性质时,往往不能直接利用样本,而需要对它进行一定的加工,这样才能用样本,而需要对它进行一定的加工,这样才能有效地利用其中的信息,否则,样本只是呈现为有效地利用其中的信息,否则,样本只是呈现为一堆一堆“杂乱无章杂乱无章”的数据的数据n【例例1.7】从某地区随机抽取从某地区随机抽取50户农民,调查其人户农民,调查其人均年收入情况,得到数据(单位均年收入情况,得到数据(单位:元)如下:元)如下:n试对该地区农民收入的水平和贫富悬殊程度做个

24、试对该地区农民收入的水平和贫富悬殊程度做个大致分析大致分析解解:显然,如果不进行加工,面对这一大堆大小显然,如果不进行加工,面对这一大堆大小参差不齐的数据,很难得出什么印象但是可以参差不齐的数据,很难得出什么印象但是可以对这些数据稍事加工,如记各农户的人均年收入对这些数据稍事加工,如记各农户的人均年收入分别为分别为x1,x2,.,x50,计算得到,计算得到 这样,就可以了解到该地区农民的平均收入和这样,就可以了解到该地区农民的平均收入和该地区农民贫富悬殊的大致情况:农民的年人均该地区农民贫富悬殊的大致情况:农民的年人均平均收入大约为平均收入大约为809.52元,标准差约为元,标准差约为155.

25、85元,元,贫富悬殊不算很大贫富悬殊不算很大1.4 统计量与抽样分布统计量与抽样分布,52.809501501 iixx85.155)(15015012 iixxs 由此可见对样本的加工是十分重要的对样本由此可见对样本的加工是十分重要的对样本加工,主要就是构造统计量加工,主要就是构造统计量1.4.1 1.4.1 统计量统计量定义定义 设设X1,X2,Xn为来自总体为来自总体X的样本,称的样本,称不含未知参数的样本的函数不含未知参数的样本的函数g(X1,X2,Xn)为为统计量统计量若若x1,x2,.,xn为样本观测值,则称为样本观测值,则称g(x1,x2,.,xn)为统计量为统计量g(X1,X2

26、,Xn)的观的观测值测值.统计量是处理、分析数据的主要工具对统计统计量是处理、分析数据的主要工具对统计量的一个最基本的要求就是可以将样本观测值代量的一个最基本的要求就是可以将样本观测值代入进行计算,因而不能含有任何未知的参数入进行计算,因而不能含有任何未知的参数1.4 统计量与抽样分布统计量与抽样分布2022-11-2630【例例1.8】设设X1,X2,Xn是来自总体是来自总体X 的一个样本的一个样本,(,(x1 1,x2 2,xn)是其观察值是其观察值.样本均值样本均值样本标准差样本标准差样本样本k k阶原点矩阶原点矩样本样本k k阶中心矩阶中心矩;11 niiXnX),.,2,1(11nk

27、XnAnikik ),.,2,1()(11nkXXnBkniik 样本方差样本方差 21221XnXnSnii212)(11XXnSnii *21)(11XXnSnii *2121XnXnSnii2022-11-2631;11 niixnx),.,2,1(11nkxnanikik ),.,2,1()(11nkxxnbkniik 其观察值其观察值:样本均值样本均值样本标准差样本标准差样本样本k k阶原点矩阶原点矩样本样本k k阶中心矩阶中心矩样本方差样本方差 xnxnxxnsniinii1221211)(11*21)(11xxnsnii *2022-11-2632 称称EX-E(X)Y-E(Y)

28、为随机变量为随机变量X与与Y的的 协方差协方差,记为记为Cov(X,Y)即即D(Y)D(X)Y)Cov(X,XY)()(),(YEYXEXEYXCov X与与Y的的相关系数相关系数:当当 XY=0时,称随机变量时,称随机变量X与与Y是是不相关的不相关的若若X,Y相互独立,则相互独立,则X与与Y不相关;反之不一定成立不相关;反之不一定成立X和和Y的的k+l 阶混合中心矩阶混合中心矩,2,1,E(Y)-YE(X)-EX lklk设设(X1,Y1),(X2,Y2),(Xn,Yn)为二维总为二维总体体(X,Y)的样本,其观测值为的样本,其观测值为(x1,y1),(x2,y2),(xn,yn),则下列各

29、量为统计量:,则下列各量为统计量:(1)样本协方差样本协方差 (2)样本相关系数样本相关系数其中其中SXY和和RXY常分别用来作为总体常分别用来作为总体X和和Y的协方差的协方差Cov(X,Y)与相关系数与相关系数 XY的估计量的估计量 1.4.11.4.1 统计量统计量 niiiXYYYXXnS1)(1YXXYXYSSSR,)(1122 niiXXXnS niiYYYnS122)(1【例例1.10】设设X1,X2,Xn是来自总体是来自总体X的样本,的样本,XN(,2),其中,其中 、2为未知参数,则为未知参数,则X1,min X1,X2,Xn 均为统计量,均为统计量,但诸如但诸如等均不是统计量

30、,因它含有未知参数等均不是统计量,因它含有未知参数 或或 常用的统计量有如下几种:常用的统计量有如下几种:1.4.1 统计量统计量,312121XX ,)(112 niiXn 1X2022-11-2635n【例例1.11】(P14)设设是任意给定的样本空间中是任意给定的样本空间中的区域,则观察值的区域,则观察值X1,X2,Xn落在落在中的频数中的频数n,频率频率f=n/n都是统计量。因为对于固定的都是统计量。因为对于固定的x,经验分布函数经验分布函数Fn(x)也是统计量。也是统计量。n研究方法时,研究方法时,为随机变量,从而为随机变量,从而 也是随机变量,也是随机变量,统计量的分布称为抽样分布

31、为了研究抽样分统计量的分布称为抽样分布为了研究抽样分布,先研究数理统计中三种重要的分布布,先研究数理统计中三种重要的分布nXXX,.,21),.,(21nXXXTT 2022-11-2636 设设X1,X2,Xn是来自总体是来自总体 N(0,1)的样本的样本,则称统计量则称统计量 的概率密度为的概率密度为2 服从自由度服从自由度n为的为的 分布分布,记为记为 2 这里自由度这里自由度n表示相互独立的随机变量的个数表示相互独立的随机变量的个数.)(22n )(2n .,0 ,0 ,)2/(21)(2122/其它yeynyfynn2022-11-2637Ff(y)的图形的图形 (与与n有关有关):

32、):1n4 n11 n0 0y6 nFf(y)的推导的推导:由前例知由前例知,21(1)()2而而Xi N(0,1),(0,1),由定义由定义Xi 2 2(1),21(),2iX再由再由X1,X2,Xn的独立性及的独立性及 分布的可加性分布的可加性即即221()2niinXf(y)2022-11-2638 分布的可加性分布的可加性 2 kjnYjj,.,2,1),(2 【定理定理1.11.1】且且Y1,Y2,Yk相互独立相互独立,则有则有 分布的分布的分位点分位点2 对于给定的正数对于给定的正数 (0(0 1)45)(45)时时,有有标准正态分布的上标准正态分布的上 分位点分位点 )(121

33、kjjkjjnYY 设设由于由于Xi独立,且注意到独立,且注意到N(0,1)的四阶矩为的四阶矩为3,可得,可得 英国统计学家费歇(英国统计学家费歇(R.A.Fisher)曾证明:)曾证明:当当n较大时,较大时,近似服从近似服从 niiXDD122)()()(22n).1,12(nN niiiXEXE1224)()(nin12)13()()(122 niiXEE niiXE12)(niinXD1)(.2)(,)(22nDnE 【定理定理1.2】卡方分布的期望与方差卡方分布的期望与方差2022-11-2640 定义定义1.2 1.2 设设XN(0,1),Y 2(n),且且X与与Y相互独立相互独立,

34、则称随机变量则称随机变量 FP(x)图形图形:(:(关于关于x=0=0 对称对称,其形状与其形状与n n有关有关)t(n)分布分布的概率密度函数为的概率密度函数为:t 服从自由度是服从自由度是n 的的t 分布分布(StudentStudent分布分布),),记作记作 T t(n)./XTYn2(1)/2(1)/2()(1),(/2)nnxp xxnnn 2/21lim()2xnp xe图图2022-11-2641f(t)n=(正态)n=10n=10tFt 分布的分位点分布的分位点:若对给定若对给定 (0(0 1)30,就可认为,就可认为t(n)基本与基本与N(0,1)相相差无几了差无几了1.4

35、.3 t分布分布 nexfxt,21)(22 2022-11-26431.4.3 1.4.3 F分布分布FF(n1,n2)分布的概率密度函数为:分布的概率密度函数为:服从自由度为服从自由度为(n1,n2)的的记为记为 FF(n1,n2).设设X 2(n1),Y 2(n2),且且X 与与Y相互独立相互独立,则称随机变量则称随机变量12/X nFY n1112/2(/2)11212()/21212()/2(/),0,()(/2)(/2)1(/)0,0.nnnnnnnnxyp xnnn x ny若若FF(n1,n2),则则 1/FF(n2,n1).),(1),(21211nnFnnF 2022-11

36、-26(C)中国民航学院 理学院 张春晓440p(x)的图形的图形F分布的分位点分布的分位点 对给定对给定 (0(0 1)1),称满足称满足的点的点F (n1,n2)为为F(n1,n2)分布的分布的 分位点分位点.F (n1,n2)5,1021nn)25,10(),(21 nn ),(21nnFFP 1.4.4 1.4.4 分位数分位数 设设X为一随机变量,我们知道对于给定的实数为一随机变量,我们知道对于给定的实数x,PX x是事件是事件X x的概率在统计中,我们常常的概率在统计中,我们常常需要对给定事件需要对给定事件X x的概率,由此确定的的概率,由此确定的x取是一取是一个临界点个临界点,称

37、为分位数称为分位数(点点),有如下定义:有如下定义:定义定义6.6 设设X为随机变量,若对给定的为随机变量,若对给定的 (0,1),存在存在x 满足满足 PX x =,则称则称x 为为X的的上上 分位数分位数(点点)1.4 统计量与抽样分布统计量与抽样分布 若若X具有密度具有密度f(x),PX x =1-说明分位数说明分位数x 右边的一块阴影面积为右边的一块阴影面积为,即即 容易看出,容易看出,X的的 分位数分位数x 是是关于关于 的增函数,的增函数,即即 增大时增大时x 减少减少.1.4.4 分位数分位数 1)(dttfx1-x 1.设设Z N(0,1),记,记N(0,1)的上的上 分位数为

38、分位数为z,即有,即有PZ z =.由由N(0,1)的概率密度的对称性可知的概率密度的对称性可知所以所以 z1-=z 2.设设 2 2(n),记,记 2(n)的上的上 分位数为分位数为 2(n),即有,即有P 2 2(n)=.附表中给出了时附表中给出了时 2(n)的值,当的值,当n40时,由时,由 2(n)的的渐近性质,有渐近性质,有 1.4.4 分位数分位数 11zZPzZPzZP22)12(21)(nzn 【例例1.13】求下列分位数求下列分位数 (1)z0.975;z0.9 (2)t0.25(4);t0.9(25);t0.05(55);(3)20.5(20);20.025(50).(4)

39、F0.05(10,15);F0.1(14,10);解:解:(1)可由标准正态分布函数表(附表可由标准正态分布函数表(附表2,P399),),对函数值对函数值(z0.975)反查表得反查表得z0.,975=1.96z0.9=(1.28+1.29)/2=1.285.(2)t0.25(4)=-t0.75(4)=-0.7407;t0.9(25)=1.3163t0.95(55)z0.95=1.6451.4.4 分位数分位数(3)查附表查附表4得:得:20.5(20)=31.4104。在附表在附表3表中查不表中查不到到 20.025(200),先查出,先查出z0.025=1.96,再作如下近似计算再作如下

40、近似计算(4)附表附表5得到得到F0.05(10,15)=2.54;在附表在附表5中,查不到中,查不到F0.1(14,10),但可查出,但可查出F0.9(10,14)=2.10,故故1.4.4 分位数分位数92.31)9996.1(21)1502(21)50(22025.02025.0 z.476.010.21)14,10(1)10,14(1.09.0FF2022-11-26(C)中国民航大學 理学院 张春晓501.4.5 正态总体的抽样分布正态总体的抽样分布【定理定理1.3】设总体设总体 样本样本(1);(2);(3)与与 相互独立。相互独立。),(2NXnXXX,.,21),(2nNXX2

41、S)1(222nnS*);1()1(222 nSn 在数理统计问题中,正态分布占据着十分重要的位置,一方面因在数理统计问题中,正态分布占据着十分重要的位置,一方面因为在应用中,许多随机变量的分布或者是正态分布,或者接近于为在应用中,许多随机变量的分布或者是正态分布,或者接近于正态分布;另一方面,正态分布有许多优良性质,便于进行较深正态分布;另一方面,正态分布有许多优良性质,便于进行较深入的理论研究因此,我们着重讨论正态总体下的抽样分布,给入的理论研究因此,我们着重讨论正态总体下的抽样分布,给出有关最重要的统计量样本均值和样本方差出有关最重要的统计量样本均值和样本方差S2的抽样分布定理的抽样分布

42、定理2022-11-26(C)中国民航学院 理学院 张春晓51E XEnXnEXiiniin()()()11111111nE XnE XE Xiinin()()()D XDnXnDXiiniin()()()11121 112121nD XnD XD Xniinin()()()=n2 212211)(XnXnESEnii )()(11212XnEXEnnii )()(1122122 nnnni2 推导推导()),(2nNX所以所以*2022-11-26(C)中国民航学院 理学院 张春晓52预备知识预备知识 n 相互独立的标准正态随机变量,则n元正态分布向量为 ,其中 为n阶单位矩阵,而 ,其中

43、。n性质:如果 ,则线性函数 仍为正态随机向量,且 。nXXX,.,21),0(),.,(1nnTnINXXX nTI,)0,.,0,0(0),(TpAANAXYnpTnA,),.,(21),(TpAANXdBXY),(TTlBBAAdBNYn(,)证明可以用随机向量方法。证明可以用随机向量方法。)1(222nnS(2)证明证明:令令 nnnnnnaaaaaaaaannnT.,.,.,/1.,/1,/1213323122221 niniiiniiniiiniiaYaYaYYnTYZ131121.)/1(T为正交矩阵为正交矩阵2112212221ZZYnYnSYnZnjinji 0)()(TYE

44、ZEnIAATYDTTYDZD )()()(所以:所以:)1(222nnS)1,0(NXYii ),(2NX独独立立。,所所以以,由由于于212222XZYX)3(SnZnSnji 2022-11-2654设设X1,X2,Xn是来自正态总体是来自正态总体N(,2)的的样本样本,X,S2分别分别是样本均值和样本方差是样本均值和样本方差,则有则有由定理由定理1,1,定理定理2 2,)1,0(/NnX 且两者独立且两者独立.由由t t分布的定义知分布的定义知.)1()1(/22 ntnnSnX 化简即得结论化简即得结论.*)(11/)(ntnSXT)(1222 nnS 2022-11-2655 设设

45、X1,X2,Xn1与与Y1,Y2,Yn2分别是来自正态总分别是来自正态总体体N(1,2)和和N(2,2)的的样本样本,且这两个样本相互独立且这两个样本相互独立.两个样本的两个样本的均值和方差均值和方差分别为分别为 X,Y,S12,S22,则有则有);1,1()1()1(1212221211 nnFnSnnSn时,当222212 )()()(2)2(2122221121212121 nntSnSnYXnnnnnn *2022-11-2656nSn222222211()1 1o o 由定理由定理2 2 知知两者相互独立,由两者相互独立,由F F 分布分布定义可知定义可知()()()()(,)nSn

46、nSnF nn11212122222212111111化简后即得化简后即得1 1o o 。证证2 2o o nSnSnn12122222212111()2()n由由的可加性:的可加性:,221221 nnNYX ),1,0(11)()(2121NnnYXU XYnnnSnSnnt nn()()()()()()1221211222221212111122t t分布的定义分布的定义化简后即得化简后即得2 2o o 。2022-11-2657例例1 设总体设总体XN(0,1),X1,X2,Xn 为为X的样本的样本,以上列举的以上列举的几个重要统计量几个重要统计量的分布是数理统计中常用的,的分布是数理

47、统计中常用的,它们的密度函数形式都较复杂,对于应用者来说,不要求它们的密度函数形式都较复杂,对于应用者来说,不要求一一推导,但是一一推导,但是查表求上查表求上 分位点分位点是统计中经常遇到的,必是统计中经常遇到的,必须须熟练掌握熟练掌握本节中的四个定理本节中的四个定理是统计推断的理论依据是统计推断的理论依据,要逐步熟悉定理的条件与结论要逐步熟悉定理的条件与结论例例2 已知已知Xt(n),求证求证),1(2nFX24321)(XXXX服从服从_?_分布。分布。则则F(1,1)2022-11-265821)(niiXX_)(2SD例例3 设总体设总体XN(,2),X,S2分别是容量为分别是容量为n

48、的样本的样本均值与样本方差均值与样本方差,则则服从服从_ 分布分布;)1(2 n 124 n 答答:2022-11-2659 1.1.X1,X2,Xn都与总体都与总体X同分布;同分布;2.2.X1,X2,Xn相互独立相互独立.样本均值样本均值;11 niiXnX212)(11XXnSnii 样本方差样本方差*2022-11-2660 分布分布 2 t 分布分布F分布分布nXDXE2)(,)(),(2nNX );1()1(222 nSn .)1(/ntnSX.2独立与SX来自正态总体来自正态总体XN(,2):);1,1(2122212221 nnFSS *2022-11-26(C)中国民航学院 理学院 张春晓61n作业:作业:1.1,1.4,1.7,1.11

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(应用数理统计第一章)课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|