1、第二章 基本数理统计知识复习1目录第一节 求和算子的运用第二节 总体、样本、分布、分布函数第三节 随机变量的数字特征第四节 一些重要的概率分布考核要求第一节 求和算子 p17一、求和符号二、求和符号的性质常数的n次求和为常数的n倍常数可提到求和符号前两个变量的求和等于对两个变量分别求和返回第二节 总体、样本、分布、分布函数一、几个定义 p18二、随机变量和概率 p20三、随机变量及其概率分布 p25返回一、几个定义 p181、实验:例:测试某批共1000灯泡的使用寿命2、总体:实验的所有可能结果的集合例:该批灯泡中每个灯泡的使用寿命,以小时计3、样本:由总体中抽出的若干个体的集合。从该批灯泡中
2、抽取100个灯泡,测试使用寿命抽取的原则:随机抽取。返回二、随机变量和概率p201、随机变量2、概率3、样本、总体和随机变量返回1、随机变量1、依据概率不同而取不同数值的这样一个变量,我们称为随机变量例:某批共1000个灯泡的使用寿命使用寿命。所以所谓总体就是一个随机变量,引入随机变量的意义就在于用一个变量来描述总体寿命(万小时)89101112个数100100600100100概率0.10.10.60.10.12、概率概率的古典定义概率的频率定义概率的性质3、样本、总体和随机变量所谓样本就是N个相互独立且与总体同分布的随机变量数理统计的一个主要工作就是由样本去推断总体的数字特征。由抽样得来的
3、100个样本灯泡的样本特征去推断1000个灯泡的数字特征总结:总体可以表示为一个随机变量,样本就是N个与总体同分布的随机变量,总体分布 就是样本和总体的联结点。返回三、随机变量及其概率分布1、概率分布2、离散型随机变量的概率分布 p253、连续型随机变量的概率分布 p25 返回1、概率分布描述变量的可能取值及与之相对应的概率我们可以通过研究随机变量生成过程来描述一个随机变量,这个过程就是概率分布寿命(万小时)89101112个数100100600100100概率0.10.10.60.10.12、离散型随机变量的概率分布 p25离散型随机变量:随机变量只能以确定的概率取有限个或有限可列个可能值。
4、离散型随机变量的概率函数:灯泡寿命之例时的概率,取值表示离散型随机变量为概率函数。iiiixX)xX(P),xX(P)xX(f1221XFXP(Xx)P(Xx)Xx1 0FX12P(xXx)FxFx分布函数:对于随机变量,令(),称为分布函数表示随机变量 取值的概率。分布函数的性质)()()()重点:区间概率的计算xba3XF(X)F(X)fx dxXfx:p(aXb)fx dx、连续型随机变量:如果随机变量 的分布函数可以写为()则称随机变量为连续型随机变量,()为概率密度函数。同样()即阴影部分面积ab第三节 随机变量的数字特征一、总体的数字特征 p37二、样本的数字特征 p48返回一、总
5、体的数字特征-对总体的描述1、数学期望2、方差3、协方差4、相关系数返回1、数学期望也称为总体均值,衡量随机变量的平均水平,是该变量可能取值与其对应概率之积的和。返回1)离散型随机变量的数学期望对应的概率为iiiixxxppx)X(E1kE(k)k,;2XY,E(XY)E(X)E(Y)3X,E(aXb)aE(x)b4X、为常数,常数的均值为其本身、对于随机变量、随机变量和的均值等于均值的和、对于随机变量随机变量线性变换的均值为均值的线性变换、当随机变量、Y相互独立时,E(XY)=E(X)E(Y)数学期望有如下性质性质同上)()(的概率密度函数为如果随机变量学期望:)连续型随机变量的数dxxf
6、x)X(ExfX2返回2、方差1)定义:离散程度的衡量,描述单个值在均值附近分布的情况 返回2xi2x2x2x)x(p)x(E)X(var对于离散型随机变量2)意义消除符号的影响,并且强调大的偏离的作用,可以比离差更好地表示出偏离程度但方差的缺点在于有量纲的影响,经过平方之后,量纲也被平方标准差:方差的平方根,量纲和随机变量相同。3)方差和均值(期望)直观认识方差不变,均值增大均值不变,方差增大Xf(x)4)方差的性质常数的方差为零,var(k)=0随机变量加上一个常数不改变变量的方差var(X+k)=var(X)随机变量常数倍的方差等于变量方差的常数平方倍var(aX)=a2var(X)(随
7、机变量线性变换的方差=?)如果两个随机变量相互独立,和之方差等于方差之和var(X+Y)=var(X)+var(Y)返回3、协方差之间是如何变动的。协方差度量了两个变量其协方差例,对于两个随机变量协)Y)(-E(X=Y)Cov(X,Y)Cov(X,YX,方差:、3YX返回协方差的意义协方差是两个随机变量线性相关关系的一个度量如果两个变量总是同时大于或小于其期望,则协方差为正如果两个变量,一个大于其均值时,另一个总是小于其均值,则协方差为负协方差,在本质上同方差一样,在衡量一种“离散”程度,对于二维随机向量(X,Y)而言,衡量了XY之间的离散程度。协方差的缺点也在于有量纲的影响,经过平方之后,量
8、纲也被平方 返回协方差的直观认识什么时候协方差为零?YXE(X)E(Y)同时大于其均值同时大于其均值一个大于其均值的同时一个大于其均值的同时另一个小于其均值另一个小于其均值4、相关系数相关系数避免了量纲的问题相关系数:对于二维随机向量(X,Y),其相关系数为返回xYcov(X,Y),11 二、样本的数字特征1、样本均值 p492、样本方差 p493、样本协方差 p504、样本相关系数 p51返回1、样本均值设从某总体中取n个样本,样本值依次为Xi,则样本均值为:iXn1X注意:我们希望知道总体的一些数字特征,特别是均值,方差等。这只有在获得所有可能的结果时,才能得到。例:灯泡的平均寿命 通常只
9、能得到关于总体的一个样本,我们的目标在于,通过获得的样本数据,对总体的数字特征进行估计,因此需要确定一个法则,将样本中我们关心的信息集中起来,这样的法则称为统计量,也称为估计量估计量 样本均值就是一个估计量样本均值就是一个估计量,拿到样本后,依据样本均值的计算法则得到的具体数字称为估计值 同时样本均值也是一个随机变量同时样本均值也是一个随机变量,样本均值的估计值依每次抽样不同而按概率取不同的值。该随机变量有它自己的均值和方差样本均值的均值和样本均值的方差nXvarXn var n1Xvarn1)x(varXXvarn1Xn1var)X(var)X(E)X(nEn1)X(En1)Xn1(E)X(
10、E)X(var)X(Exii2i2ii2iiiii)()()(之间相互独立)()(的无偏估计)(样本均值是总体均值,方差,其均值随机变量返回2、样本方差22xi1S(XX)n1注意样本方差同样是个估计量,由具体某个样本计算得到的样本方差的数值为估计值样本方差同样是个随机变量,有它自身的均值和方差关于1/(n-1):可以用自由度的概念来解释可以证明:样本方差的均值=总体方差的均值即样本方差是总体方差的无偏估计。样本方差存在量纲问题样本标准差sx:为样本方差的平方根 返回3、样本协方差例题样本协方差为的随机样本,则该样本有来自于该总体)(例:对于二维随机向量p501n)YY)(XX()Y,X(co
11、v,Y,Xii返回4、样本相关系数1r1,SS)Y,X(covrYx返回第四节 一些重要的概率分布 p56一、正态分布二、卡方分布三、t分布四、分布返回一、正态分布1、正态分布的表示2、正态分布的性质3、正态分布的标准化4、样本均值的概率分布5、中心极限定理返回221XXNX、正态分布:对于随机变量,(,),称 服从均值为,方差为的正态分布。返回2、正态分布的性质 围绕均值u中心对称,曲线下总面积为1,钟形分布P(xu)=0.5 根据均值和方差,可求得随机变量落入任何区间的概率阴影部分面积即为0.95,而1.96倍标准差的概率为0.025 正态分布变量的线性变换仍然服从正态分布。两个正态分布变
12、量的线性组合仍然服从正态分布。96.1-96.1返回3、正态分布的标准化XN(0,1)称随机变量X服从标准正态分布任何一个正态分布都可以变换为标准正态分布),(,则令),(10NZ-XZNX2标准化后简化计算概率1、某行业 工人的工资服从均值700,标准差为100的正态分布,则,95%的工人的工资范围为多少?工资高于800和低于400的概率各为多少?2、p59,例4-2:面包房每日面包出售数量服从均值为70,方差为9的正态分布,求单日面包销售量75的概率?返回4、样本均值的概率分布样本均值是个随机变量,有它自身的分布、均值、方差,即样本均值的抽样分布/概率分布P61 例题4-6xx2,X,nX
13、依据统计理论,某正态总体,其均值为标准差为则 的抽样分布服从均值方差的正态分布 其方差的平方根称为 的标准误。返回P63 例题例题4-7,n为,均值xn,为,均值具有同分布,X如果独立随机变xxi的正态分布标准差于的抽样分布越来越接近的增大,样本均值则随着样本容量对其抽样,标准差其量5、中心极限定理运用中心极限定理,方便了我们对总体均值的概率推估注意:对随机变量x本身具体服从什么分布不做要求,只要相互独立,其和渐近于正态分布,主要是大量变量相加后,许多随机因素相互抵消的缘故。NXX对其标准化:返回P63 例题例题4-7的变换,(设的变换,(设x不服从正态分布)不服从正态分布)二、卡方分布 p6
14、71、卡方分布的表示2、卡方分布的性质3、关于卡方分布的两个定理4、卡方分布用于对样本方差进行假设检验和统计推断返回1、N个服从标准正态分布的独立的随机变量的平方和服从自由度为N的卡方分布 返回1222221.(0,1).,()ninXXXNXXn有个随机变量,相互独立,定义则2、的性质1)卡方分布只取正值2)卡方分布是斜分布,随着自由度的增大,逐渐对称并接近正态分布。3)两个服从卡方分布的独立随机变量,其和也服从卡方分布。返回23、关于卡方分布的两个定理12.(0,1)niXXXN22ii1)有个随机变量,相互独立,则X和(X-X)相互独立,且(X-X)(n-1)222x2x22xxn1SX
15、 N(n-1),Sn()2)(,),则有其中为样本方差,为总体方差,为样本容量4、卡方分布用于对样本方差进行假设检验和统计推断例题,P4-14:假定来自正态总体(总体方差=8)的某个随机样本,样本容量为20,若样本方差为16,求得此方差的概率(样本方差大于16的概率)。返回三、t分布1、t分布的表示2、t分布的性质3、t分布运用返回1、t分布的表示分布。的服从自由度为即,则定义)(),随机变量,(设随机变量tnt),n(ttnYXtnY10NX2)1n(tnSx1nS)1n(nxt,1nS)1n()0,1(nx,n为,均值xnxxx2x2x22x2xx则:)(而则:的正态分布标准差于的抽样分布
16、越来越接近的增大,样本均值随着样本容量回忆中心极限定理:返回2、t分布的性质1)t分布和标准正态分布非常类似,对称分布。2)t分布均值为0,方差为k/(k-2),k为自由度当样本容量增大时,t分布方差快速趋向1。返回3、t分布的运用总体方差已知时,用正态分布进行假设检验和统计推断,但当总体方差未知时,用t分布进行假设检验和统计推断65,例4-8:在15天内每天出售面包的平均数量为74条,样本标准差为4,假定真实平均销售量为70,求能取得该样本的概率?(注意和例4-2区别)P66,例4-12返回四、分布1、分布的表示2、分布的性质3、分布的运用返回1、分布的表示)nn(FF,nYnXF,nY,n
17、X21211212则则定义且相互独立,)()(如果随机变量返回2、分布的性质1)非负,斜分布2)自由度增大时,趋近与正态分布返回3、分布用于检验两个总体的方差是否相同)1n,1n(FSS1nS1n1nS1nF)1n(S1n)1n(S1nn,n212Y2Y2x222Y2Y212x21222Y2Y2122x2121XXX)()()()(则)()(我们知道:的样本容量分别为,分别抽样,则有两组设有两个正态分布总体p70,例题4-16:一个班有100名学生,另一个150名学生,从第一个班随机抽取25个学生,从第二班中随机抽取31个学生,成绩的样本方差分别为100、132,能否认为两班成绩同方差?返回本章考核要求领会估计量、估计值、总体各数字特征、样本各个数字特征掌握各分布的随机变量的概率的计算作业P724.134.174.20