1、1 总体与样本 2 直方图与样本分布函数 3 样本函数及概率分布 4 分布 5 t 分布 6 F 分布,第六章 样本及样本函数的分布,1 总体与样本,1.1 总体,所研究对象的全体称为总体.,总体中的每个元素(即每一个研究对象)称为个体,若总体中包含有限个个体,则称这个总体为有限总体.,否则称为无限总体,总体中所包含的个体总数称为总体容量.,在统计问题中,人们所关心的往往不是总体的一切方面,而是它的某一项数量指标X因此,我们把这个数量指标X所有可能取值的全体就作为总体看待,称为总体X,X是一个随机变量我们要根据试验或观察得到的数据来得到X的概率分布和数字特征,分别称为总体的分布和数字特征,1.
2、2 简单随机样本,从总体中抽取若干个个体过程称为抽样。,抽样结果得到X的一组试验数据(观测值)称为样本。,样本中所含的个体的数量称为样本容量。,简单随机抽样,1. 随机性 为了使测试到的数据能很好地反映总体的情 况,要求总体中每一个个体被抽到的可能性是均等的。,2. 独立性 各次抽取必须是独立的,即每次的抽样结果之间互不影响。,从总体 X 中抽取 n 个个体进行简单随机抽样,把测试结果分别记作X1,X2,, Xn Xi可以取 X 所有可能的值,是与 X 具有相同分布的随机变量,且X1,X2,Xn 相互独立,简单随机样本,若总体 X 的样本 满足:,(1) 与X 有相同的分布,(2) 相互独立,
3、则称 为来自总体X的简单随机样本.简称样本。,n 称为样本容量,在对总体X进行一次具体的抽样并作观测之后,得到样本(X1,X2,Xn)的确切的数值(x1,x2,xn),称为一个样本观测值(观察值),简称样本值,样本(X1,X2,Xn)所有可能取值的全体称为样本空间,样本观察值(x1,x2,xn)是样本空间中的一个点,如果从总体X 中抽取到样本观测值x1,x2,xn,则可认为相互独立事件 同时发生。,2 直方图与样本分布函数,2.1 直方图,(3)选取分点,把区间 分为 个子区间,第 个子区间 的长度为,若取各子区间长度相等,则有,记 称 叫做组距。,此时分点,注:分点 应比样本观测值 多取一位
4、有效数字。,(4)数出 落在每个子区间 内的频数 ,,再算出频率,直方图作用,第 个小矩形的面积等于样本观测值落在该子区间内的频率。,所有小矩形的面积之和等于1.,直方图可以大致反映随机变量的概率分布。,例2.1 某门课程有120人参加考试,考试成绩X如下:,试根据这些数据作出直方图,并根据直方图估计X 的分布,86 83 77 81 81 80 79 82 82 81,83 65 64 78 75 82 80 80 77 81,81 87 82 78 80 81 87 81 77 78,77 78 77 77 77 71 95 78 81 79,80 77 76 82 80 82 84 79
5、 90 82,79 82 79 86 76 78 83 75 82 78,73 83 81 81 83 89 81 86 82 82,78 84 84 84 81 81 74 78 78 80,74 78 75 79 85 75 74 71 88 82,76 85 73 78 81 79 77 78 81 87,75 83 90 80 85 81 77 78 82 84,85 84 82 85 84 82 85 84 78 78,解 从n=120个数据中找出最小值x(1)= 64及最大值x(120)= 95,取 a = 63.5, b = 95.5, 分 k = 16 组,组距,以横轴 x 轴
6、表示成绩,a= t0= 63.5,t1=65.5, t15= 93.5, b= t16 = 95.5, t = 2, 在(ti-1,ti上,做高为 的矩形。,2.2 样本分布函数,样本能够反映总体X的信息,总体X的分布函数F(x)是否能由样本来“表示”?回答是,肯定的。,定义 设总体X的分布函数 ,从总体 中抽取容量为 的样本,样本观测值为 (相同的观测值可重复出现),假设 个观测值中有 各不相同的值,按由小到大顺序依次记为,设 出现的频数为 ,则 出现的频率为,显然有 则称,为总体X的样本分布函数,样本分布函数Fn(x)不仅与样本容量 n 有关, 还与所得到的样本观察值有关,Fn(x)的图形
7、呈跳跃上升的台阶状, 图中的曲线是总体 X 的理论分布函数F(x)的图形,总结:对于样本观察值(x1,x2,xn),为了求其对应的样本分布函数Fn(x)之值,只须将这 n 个值中小于或等 x 的个数除以样本容量 n 即可对于给定的x,Fn(x)是 n 次重复独立试验中事件Xx出现的频率,而理论分布函数F(x)是事件Xx发生的概率,由伯努利定理知,对任意给定的正数,有 , 即Fn(x)按概率收敛于F(x)。,样本分布函数Fn(x)具有以下性质:,(1) 0Fn(x)1;,(2) Fn(x)是单调不减函数;,(3) Fn()=0, Fn(+)=1,(4) Fn(x)是处处右连续的.,定理(格利文科
8、(W.Glivenko)定理) 设总体X的分布函数为F(x), 样本分布函数Fn(x),则对于任何实数x,有,设 是取自总体X 的一个样本,样本函数.,为样本函数观测值。,3 样本函数及其概率密度,为一 元实值连续函数,则称随机变量 为,如果 不含有未知参数,则称这种样本函数为统计量。,是统计量。,不是统计量。只是样本函数。,常用的统计量,1.样本均值,观测值为,由于 相互独立,因此,2.样本方差,观测值为,推导如下:,3.样本标准差,4.样本k 阶原点矩,注:样本一阶原点矩就是样本均值。,5.样本的k 阶中心矩,注:样本二阶中心矩,6.样本最大值和样本最小值,为,分别作为随机变量 和 的观测
9、值,,分别记为 和,例3.1 从一批机器零件毛坯中随机地抽取10件, 测得其重量为(单位: 公斤): 210, 243, 185, 240, 215, 228, 196, 235, 200, 199 求这组样本值的均值、方差、二阶原点矩与二阶中心矩.,解,例3.2 在总体 中,随机抽取一个容量为36的样本,求样本均值 落在50.8到53.8之间的概率.,解,故,定理3.2 设 , ,分别独立的从总体 X 和总体Y 中抽取样本 和 ,样本均值分别为 和 。则随机变量,4 分布,定义4.1 设 , 是来自总体 X 的样本,则称统计量,为服从自由度为 n 的 分布,记作,概率密度,图像,分布的性质:
10、,性质1:设 ,则E( )=n,D( )=2n,证:因XiN(0,1),E(Xi2)=1 ,D(Xi)=1,性质3:设 ,则对任意实数 有,定义4.2 设 ,对于给定的正数 ,,称满足条件,的点 为 分布的上 分位点(数)。,例如 取,则查附表有,则查附表,n = 10,定理4.1 设 为X的样本,则,证: ,且相互独立,由定义,(1),(2) 和 相互独立。,例4.1 设X1,X2,X10 为总体N (0, 0.09)的一个样,本,求,解,则有,例4.2 设总体 ,样本X1,X2, , X6,设Y = ( X1+X2+X3 )2 + ( X4+X5+X6 )2,求C,使CY 服从 分布,并求
11、自由度,由独立性有 ,,因此取 ,有,自由度为2,5 t 分布,定义5.1 设XN (0,1),Y (n),且 X 与Y 独立,则称随机变量,服从自由度为 n 的 t 分布,记作t t (n),t (n)分布的概率密度,图像,性质:t (n)分布的概率密度关于 y 轴对称,且,定义5.2 设 t t (n),对于给定正数 ,称满足条件,的点 为t (n)分布的上 分位点。,t,-t,注,n很大时,例,定理5.2 正态总体 与 相互独立,则随机变量,6 F 分布,定义6.1 设 且 X 与 Y 独立,则称 随机变量,为服从自由度是m、n的F分布,记作FF (m,n).,其中m 称为第一自由度, n称为第二自由度,F(m,n)分布的概率密度为,图像,定义6.2 设FF(m, n),对于给定正数 ,称满 足条件,的点 为F(m, n)分布的上 分位点。,注,证,由于 ,因而,得到,
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。