1、7.5 正态分布正态分布讲课人:邢启强2高斯是一个伟大的数学家,一生中的重要贡献不胜枚举德国的10马克纸币上印有高斯的头像和正态分布的曲线,这就传达了一个信息:在高斯的科学贡献中,对人类文明影响最大的是正态分布那么,什么是正态分布?正态分布的曲线有什么特征?新课引入新课引入讲课人:邢启强3 正态分布在统计学中是很重要的分布。我们知道,正态分布在统计学中是很重要的分布。我们知道,离散型随机变离散型随机变量量最多取可列个不同值,它等于某一特定实数的概率可能大于最多取可列个不同值,它等于某一特定实数的概率可能大于0,人们感,人们感兴趣的是它取某些特定值的概率,即感兴趣的是其分布列;兴趣的是它取某些特
2、定值的概率,即感兴趣的是其分布列;连续型随机连续型随机变量变量可能取某个区间上的任何值,它等于任何一个实数的概率都为可能取某个区间上的任何值,它等于任何一个实数的概率都为0,所,所以通常感兴趣的是它落在某个区间的概率。以通常感兴趣的是它落在某个区间的概率。我们称这类随机变量为连续型随机变量(continuous random variable).离散型随机变量的概率分布规律离散型随机变量的概率分布规律用分布列描述,而连续型随机变量的概率分布规律用密度函数(曲线)用分布列描述,而连续型随机变量的概率分布规律用密度函数(曲线)描述。描述。新课引入新课引入讲课人:邢启强4 问题问题:自动流水线包装的
3、食盐,每袋标准质量为400g.由于各种不可控的因素,任意抽取一袋食盐,它的质量与标准质量之间或多 或少会存在一定的误差(实际质量减去标准质量).用X表示这种误差,则X是一个连续型随机变量.检测人员在一次产品检验中,随机抽取了100袋食盐,获得误差X(单位:g)的观测值如下:-0.6-1.4-0.7 3.3-2.9-5.2 1.4 0.1 4.4 0.9-2.6-3.4-0.7-3.2-1.7 2.9 0.6 1.7 2.9 1.2 0.5-3.7 2.7 1.1-3.0-2.6-1.9 1.7 2.6 0.4 2.6-2.0-0.2 1.8-0.7-1.3-0.5-1.3 0.2-2.1 2.
4、4-1.5-0.4 3.8-0.1 1.5 0.3-1.8 0.0 2.5 3.5-4.2-1.0-0.2 0.1 0.9 1.1 2.2 0.9-0.6-4.4-1.1 3.9-1.0-0.6 1.7 0.3-2.4-0.1-1.7-0.5-0.8 1.7 1.4 4.4 1.2-1.8-3.1-2.1-1.6 2.2 0.3 4.8-0.8-3.5-2.7 3.8 1.4-3.5-0.9-2.2-0.7-1.3 1.5-1.5 -2.2 1.0 1.3 1.7-0.9(1).如何描述这100个样本误差数据的分布?(2).如何构建适当的概率模型刻画误差X的分布?新课引入新课引入讲课人:邢启强
5、5 可用频率分布直方图描述这组误差数据的分布,如右图.所示.频率分布直方图中每个小矩形的面积表示误差落在相应区间内的频率,所有小矩形的面积之和为1.根据频率与概率的关系,可用以用上图中的钟型曲线来描述袋装食盐质量误差的概率分布.曲线与水平轴之间的面积为1任意抽取一袋盐,误差落在-2,-1内的概率如何表示?可以用图中黄色阴影部分的面积表示.学习新知学习新知误差观测值有正有负,并大致对称地分布在X=0的两侧,而且小误差比大误差出现得更频繁随着样本数据量越来越大,让分组越来越多,组距越来越小,由频率的稳定性可知,规率分布直方图的轮廓就越来越稳定,接近一条光滑的钟形曲线,如右图所示。讲课人:邢启强62
6、.正态密度曲线(简称)0YX相应的函数解析式为:称为正态密度函数,0)(,xfRx对.轴上方它的图象在x1面积为轴和曲线之间的区域的x学习新知学习新知讲课人:邢启强7正态分布的定义正态分布的定义22()21(),2xXf xexR若随机变量 的概率分布密度函数为).1,0(NX即y012-1-2x-33=0=1学习新知学习新知对任意的xR,f(x)0,它的图象在x轴的上方.可以证明x轴和曲线之间的区域的面积为1.我们称f(x)为正态密度函数,称它的图象为正态密度曲线,简称正态曲线,如上图所示.若随机变量X的概率分布密度函数为f(x),则称随机变量X服从正态分布(normal dis-tribu
7、tion),记为XN(u,2).特别地,当u=0,=1时,称随机变量X服从标准正态分布.若XN(u,2),则如上图所示,X取值不超过x的概率P(X)为图中区域A的面积,而P(aXb)为区域B的面积.讲课人:邢启强8正态分布在概率和统计中占有重要地位,它广泛存在于自然现象、生产和生活实践之中.在现实生活中,很多随机变量都服从或近似服从正态分布例如,某些物理量的测量误差某一地区同年龄人群的身高、体重、肺活量等一定条件下生长的小麦的株高、穗长、单位面积产量自动流水线生产的各种产品的质量指标(如零件的尺寸、纤维的纤度、电容器的电容)某地每年7月的平均气温、平均湿度、降水量等一般都近似服从正态分布讲课人
8、:邢启强9右图所示的就是一块高尔顿板示意图右图所示的就是一块高尔顿板示意图.在一块木板上钉上在一块木板上钉上若干排相互平行但相互错开的圆柱形小木块,小木块之若干排相互平行但相互错开的圆柱形小木块,小木块之间留有适当的空隙作为通道,前面挡有一块玻璃让一个间留有适当的空隙作为通道,前面挡有一块玻璃让一个高尔顿板高尔顿板小球从高尔顿板上方的通道口落下,小球在下落过程中与小球从高尔顿板上方的通道口落下,小球在下落过程中与层层小木块碰撞,最后掉入高尔顿板下方的某一球槽内层层小木块碰撞,最后掉入高尔顿板下方的某一球槽内如果把球槽编号,就可以考察到底是落在第几号球槽中.重复进行高尔顿板试验,随着试验次数的增
9、加,掉入各个球槽内的小球的个数就越来越多,堆积的高度也会越来越高.各个球槽的堆积高度反映了小球掉入各球槽的个数多少?Oxy讲课人:邢启强10例例1、下列函数是正态密度函数的是(、下列函数是正态密度函数的是()A.B.C.D.22()21(),(0)2xf xe 都是实数2 22()2xf xe2(1)41()2 2xf xe221()2xf xeB典型例题典型例题正态密度正态密度的函数表示式的函数表示式22()2,1()2xxe),(x讲课人:邢启强11具有两头低、中间高、左右对称的基本特征012-1-2xy-3=-1=0.5012-1-2xy-33=0=1012-1-2xy-334=1=2.
10、0,21)(222)(为参数其中RRxexfx思考:一个正态分布由参数和完全确定,这两个参数对正态曲线的形状有何影响?它们反映正态分布的哪些特征?讲课人:邢启强12012-1-2xy-3=-1=0.5012-1-2xy-33=0=1012-1-2xy-334=1=2(1)对称性:曲线是单峰的,它关于直线x=对称.(2)最值性:曲线在x=处达到峰值(最高点)1 1 22x=x=x=.0,21)(222)(为参数其中RRxexfx(3)当 无限增大时,曲线无限接近 轴.当x(,时,为增函数.当x,+)时,为减函数.值域为21,0(讲课人:邢启强13.0,21)(222)(为参数其中RRxexfx)
11、()(xfyxfy参数参数 含义及对正态曲线的形状的影响含义及对正态曲线的形状的影响,一个正态分布由参数 和 完全确定,这两个参数对正态曲线的形状有何影响?它们反映正态分布的哪些特征?学习新知学习新知讲课人:邢启强14 312=1=-1=0=1若 固定,随 值的 变化而沿x轴平移,故 称为位置参数;(1).当参数 取定值时,位置反映了正态分布的集中参数讲课人:邢启强15=0.5=1=2=0若 固定,大时,曲线“矮而胖”;小时,曲线“瘦而高”,故称 为形状参数.所以越大,曲线越“矮胖”,表示总体的分布越分散;越小,曲线越“瘦高”,表示总体的分布越集中.成反比,与峰值21轴曲线与又x,0.1围成的
12、面积为(2).当参数 取定值时.的离散程度相对于均值反映了随机变量的分布则若),(2NX2)(,)(XDXE讲课人:邢启强16例:李明上学有时坐公交车,有时骑自行车,他各记录了50次坐公交车和骑自行车所花的时间,经数据分析得到:坐公交车平均用时30min,样本方差为36;骑自行车平均用时34min,样本方差为4.假设坐公交车用时X和骑自行车用时Y都服从正态分布。(1)估计X,Y的分布中的参数;(2)根据(1)中的估计结果,利用信息技术工具画出X和Y的分布密度曲线;(3)如果某天有38min可用,李明应选择哪种交通工具?如果某天只有34min可用,又应该选择哪种交通工具?请说明理由。分析:对于第
13、(1)问,正态分布由参数和 完全确定,根据正态分布参数的意义可以分别用样本均值和样本标准差来估计.对于第(3)问,这是一个概率决策问题,首先要明确决策的准则,在给定的时间内选择不迟到概率大的交通工具;然后结合图形,相据概率的表示,比较概率的大小,作出判断解:(1)随机变量X的样本均值为30,样本标准差为6;随机变量Y的样本均值为34,样本标准差为2.用样本均值估计参数.用样本标准差估计参数,可以得到XN(30,6),YN(34,2).(2)X和Y的分布密度曲线如图所示,(3)应选择在给定时间内不迟到的概率大的交通工具.由图可知,Y的密度曲线X的密度曲线P(X38)P(Y 34).所以,如果有3
14、8min可用,那么骑自行车不迟到的概率大,应选择骑自行车;如果只有34min可用,那么坐公交车不迟到的概率大,应选择坐公交车,26 30 3438tyO的密度曲线X的密度曲线Y讲课人:邢启强17_,),1,0()1(的密度函数为则设随机变量XNX._)0(XP221()2xf xe5.0求出总体随机是一条正态曲线如右图1,)2(.态密度函数的解析式变量的期望和方差和正2,2022(20)41()2xf xe,(21)3(222)(Rxeiixii已知三个正态密度函数)(,)3,2,1则的图象如右图所示i321321321321,.,.BA321321321321,.,.DCD典型例题典型例题讲
15、课人:邢启强182323可以证明:假设),(2NX,().kNPkXkk对给定的是一个只与 有关的定值特别地6827.0)(XP9545.0)22(XP(33)0.9973PX正态分布的正态分布的3原则原则学习新知学习新知尽管正态变量的取值范围是(,+),但在一次试验中,的取值几乎总落在区间3,+3内,而在此区间外取值的概率大约只有0.0027,通常认为这种情况几乎不可能发生.在实际应用中,通常认为服从于正态分布(,2)的随机变量只取3,+3中的值,这在统计学中称为3原则.讲课人:邢启强19例例3.在某次数学考试中,考生的成绩X服从正态分布XN(90,100).(1).求考试成绩X位于区间(7
16、0,110)上的概率是多少?(2).若此次考试共有2000名考生,试估计考试成绩在(80,100)间的考生大约有多少人?解:(1)依题意,X XN(90,100),N(90,100),90,10.0.95425(2)PX即考试成绩在(80,100)间的概率为0.6827.考试成绩在(80,100)间的考生大约有6827.0)(XP13656827.02000(70110)PX)10080()2(XP讲课人:邢启强20例4.若XN(5,1),求P(6X7).解:因为XN(5,1),故正态密度曲线关于直线 x=5 对称,1(57)(37)2PxPx1(56)(46)2PxPx(67)(57)(56
17、)PxPxPx 1(52 152 1)2Px 47725.09545.02134135.06827.0211359.034135.047725.0讲课人:邢启强21例例2、把一个正态曲线、把一个正态曲线a沿着横轴方向向右移动沿着横轴方向向右移动2个单位,得到个单位,得到新的一条曲线新的一条曲线b。下列说法中不正确的是(。下列说法中不正确的是()A.曲线曲线b仍然是正态曲线;仍然是正态曲线;B.曲线曲线a和曲线和曲线b的最高点的纵坐标相等的最高点的纵坐标相等;C.以曲线以曲线b为概率密度曲线的总体的期望比以曲线为概率密度曲线的总体的期望比以曲线a为概率密为概率密度曲线的总体的期望大度曲线的总体的
18、期望大2;D.以曲线以曲线b为概率密度曲线的总体的方差比以曲线为概率密度曲线的总体的方差比以曲线a为概率密为概率密度曲线的总体的方差大度曲线的总体的方差大2。D典型例题典型例题讲课人:邢启强22 1).若XN(,2),问X位于区域(,+)内的概率是多少?解:由正态曲线的对称性可得,1()()0.34132PxPx2.(1,),(4)0.9,(1)2)3()X NP XPX 已知若则6.0.4.0.3.0.2.0.DCBAC(0,1),(1)_,(12)_,(1)_.XNP XP XP X设随机变量则6827.08413.01587.0巩固练习巩固练习讲课人:邢启强232、已知、已知XN(0,1
19、),则,则X在区间在区间 内取值的概率等于(内取值的概率等于()A.0.9545 B.0.0456 C.0.9772 D.0.022753、设离散型随机变量、设离散型随机变量XN(0,1),则则 =,=.(,2)(0)P X(22)PX D0.50.95451、已知一次考试共有、已知一次考试共有60名同学参加,考生的成绩名同学参加,考生的成绩XN(100,52),据此,据此估计,大约应有估计,大约应有57人的分数在下列哪个区间内?(人的分数在下列哪个区间内?()A.(90,110 B.(95,125 C.(100,120 D.(105,115A巩固练习巩固练习讲课人:邢启强24课堂小结课堂小结
20、.0,21)(222)(为参数其中RRxexfxOxy1.正态曲线及正态密度函数2.正态分布),(2NX2)(,)(XDXE讲课人:邢启强25(1 1)曲线在)曲线在x轴的上方,与轴的上方,与x轴不相交轴不相交.(2)曲线是单峰的)曲线是单峰的,它关于直线它关于直线x=对称对称.3 3、正态曲线的性质、正态曲线的性质(4)曲线与)曲线与x轴之间的面积为轴之间的面积为1(3)曲线在)曲线在x=处达到峰值处达到峰值(最高点最高点)1 1 2222()21(),(,)2xxex (6)当当一定时,曲线的形状由一定时,曲线的形状由确定确定.越大,曲线越矮胖,表示总体的分布越分散;越大,曲线越矮胖,表示总体的分布越分散;越小,曲线越瘦高,表示总体的分布越集中越小,曲线越瘦高,表示总体的分布越集中.(5)当)当 x时时,曲线下降曲线下降.并且当曲线并且当曲线向左、右两边无限延伸时向左、右两边无限延伸时,以以x轴为渐近线轴为渐近线,向它无限靠近向它无限靠近.=0.5012-1-2xy-33X=1=2讲课人:邢启强266827.0)(XP9545.0)22(XP(33)0.9973PX34.正态分布的 原则
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。