1、第五章第五章 正态分布正态分布第一节第一节 正态分布的概念与性质正态分布的概念与性质第二节第二节 正态分布表的使用正态分布表的使用第三节第三节 正态分布理论在体育中的应用正态分布理论在体育中的应用第一节第一节 正态分布的概念与性质正态分布的概念与性质一、概念一、概念 正态分布:正态分布:靠近均数分布的频数最多,离开均数越远,分布的数据越少,左右两侧基本对称,这种中间多、两侧逐渐减少的基本对称的分布即正态分布。正态曲线:正态曲线:是一条中央高,两侧逐渐下降,两端无限延伸,与横轴相靠而不相交,左右完全对称的钟形曲线。从频数分布图从频数分布图到正态分布图:到正态分布图:正态分布的数学定义:正态分布的
2、数学定义:若随机变量若随机变量X的概率分布密度函数是:的概率分布密度函数是:v位置参数:位置参数:(决定曲线的位置决定曲线的位置)v变异度参数:变异度参数:(决定曲线的形状决定曲线的形状)22221()12,0,(,)xf xexXX ()都是常数 且称随机变量服从参数为 和 的正态分布 记为。二、正态曲线(概率密度曲线)的特点:二、正态曲线(概率密度曲线)的特点:v(1)关于 对称。v(2)在 处有最大值,在区间 上,v(3)曲线下总面积为1。v(4)决定曲线在横轴上的位置,增大,曲线沿横轴向右移;反之,曲线沿横轴向左移。xx(,)(),(,),();,f xf xxx 单调上升 在单调下降
3、当时 曲线以 轴为渐近线。v(5)决定曲线的形状,当 恒定时,越大,数据越分散,曲线越“矮胖”;越小,数据越集中,曲线越“瘦高”。习惯上用N(,2)表示均数为 、标准差为 的正态分布。v下列图中显示了不同的均数和标准差的正态曲线图。不同平均数和标准差的正态分布图不同平均数和标准差的正态分布图 不同标准差的正态分布图不同标准差的正态分布图三、标准正态分布三、标准正态分布v参数参数 的正态分布,称为标准正态的正态分布,称为标准正态分布,记为分布,记为 ,则概率分布密度函数,则概率分布密度函数为:为:标准正态分布曲线见标准正态分布曲线见图图7。v非标准正态分布与标准正态分布的关系非标准正态分布与标准
4、正态分布的关系 对于任一均数为对于任一均数为 ,标准差为,标准差为 的随机变量的随机变量X的的012,(0,1)XN221()2xfxe ()正态分布,都可以作一个变量代换,将非标准正态正态分布,都可以作一个变量代换,将非标准正态分布的概率密度函数改造成标准正态分布的概率密分布的概率密度函数改造成标准正态分布的概率密度函数:度函数:令令 ,则,则:通过变量代换,将(通过变量代换,将(1)式中的平均数和标准差分)式中的平均数和标准差分别转换成了别转换成了0和和1。从而达到简化计算的目的。从而达到简化计算的目的。xu222221()21()2xufxefue ()可 写 为:()01,图图7 7
5、标准正态曲线标准正态曲线v 将一般正态分布转换成标准正态分布,实际上是将原始变量X转换成标准变量U的过程。在此过程中,正态分布的曲线性质并没有发生改变。v 在具体研究工作中,通常难以获得总体均数 和总体标准差 ,所以在变量标准化时,以样本均数和标准差来替代。所以变量标准化的公式变为:xxus第二节第二节 正态分布表的使用正态分布表的使用v正态分布表简况正态分布表简况v正态分布表的使用和计算方法正态分布表的使用和计算方法正态分布表简况正态分布表简况v正态分布表(见附表正态分布表(见附表1)是在运用正态分布理)是在运用正态分布理论解决具体问题时所采用的一种非常有用的论解决具体问题时所采用的一种非常
6、有用的工具。工具。横轴变量横轴变量uv正态分布表的构成正态分布表的构成 350个数据个数据 u变量所对应的变量所对应的 行值范围行值范围 0.00,0.09 列值范围列值范围 0.0,3.40.500,0.9998v由于正态分布的对称性,所以附表1中只给出了变量 时的概率值;若要求 的概率值,虽无法直接求得,但可通过正态分布的对称性来求。0u 0u 正态分布表的使用和计算方法正态分布表的使用和计算方法v根据 变量的值查出对应的的面积(概率)v根据面积(概率)找出相对应的 变量的值。1.求 的面积,其中 。直接查正态分布表即可求得。例1:求 的概率。在正态分布表上查到u=2.25处的值为0.98
7、78,即为所求的概率。UU(,)u0u(,2.25)2.求 的面积(概率),其中 。由于附表1中只有u0时的概率值,所以不能直接求得u为负值时的概率值。但可通过正态分布的对称性质来求。例2:求 的概率值。根据对称性,的概率值(或面积)与(1,+)的概率值相等。再根据整个曲线下的概率为1,可用1减去 (,)u0u(,1)(,1)(,1)的概率,即得到所求的概率,见图8。(1)1(1)10.84130.1587 图图8 8v3.求某个u值以上的面积,见图9。例 3:求 的概率。查表可知 ,所以,所求面积为:图图9 91.96,(1.96)0.97501(1.96)0.0254.求两个正u值所围成的
8、面积(概率)例4:求(1.5,2.0)区间所围成的面积,见图10。图图1010 所求面积为:5.求两个负u值所围成的面积(概率)。例5:求(-2,-1)所围成的面积(概率),见图11。(2)(1.5)0.97720.93320.0440图图1111 根据正态分布的对称性可知,(-2,-1)区间的面积与(1,2)区间的面积相等,所以所求面积为:6.求一个负u值与一个正u值所围成的面积。例6:求(-1.55,0.7)区间的面积(概率),见图12。(2)(1)0.9772 0.8413 0.1359图图1212所求面积为:7.已知某区间的面积,求对应的u值。例7:已知(-1.45,u)的面积为0.6
9、578,求所对应的u值,见图13。分析(-1.45,0)区间的面积小于0.5,所以该u值应该大于0,故0.6578是-1.45到某一(0.7)(1.55)(0.7)1(1.55)(0.7)(1.55)1 0.7580 0.9394 10.6974 正u值所围成的面积,根据求某区间面积的方法,有-1.45uP=0.6578()(1.4 5)()(1.4 5)1()1(1.4 5)puuup所 以 =0.6 5 7 8+1-0.9 2 6 5 =0.7 3 1 3图图1313查附表1,得到u值为0.62。在实际统计工作中,常用到u值及相应的面积(概率)见图14。图图 1414习题v1.求 的面积(
10、概率).v2.求 以及 的面积(概率).v3.求 的面积.v4.求(-1.96,1.96)的概率和P(|z|1.96).v5.求(-2.58,2.58)的面积.v6.求(0.17,1.34)的概率.v7.已知某区间(-3.02,u)的面积为0.2413,求u?v8.已知某区间(u,1.55)的面积为0.7340,求u?v9.已知某区间(u,1.32)的面积为0.3056,求u?(,)(0,)(,0)(,3.49)第三节第三节 正态分布理论在体育中的应用正态分布理论在体育中的应用一、正态分布理论在制定考核标准研究中的应用一、正态分布理论在制定考核标准研究中的应用二、正态分布理论在人数估计研究中的
11、应用二、正态分布理论在人数估计研究中的应用三、正态分布理论在制定离差评价表中的应用三、正态分布理论在制定离差评价表中的应用四、正态分布理论统一变量单位在综合评价中的四、正态分布理论统一变量单位在综合评价中的应用应用例1:已知某项考试成绩 ,请回答以下问题(前3问的概率均从负无穷开始计):1.P=0.25时,得分是多少?2.P=0.75时,得分是多少?3.P=0.90时,得分是多少?4.成绩最好的5%的得分在多少分以上?5.得分在80分以上的占总体的百分之几?6.得分在60分以下的占总体的百分之几?2(72,12)XN 例2:某地某年120名8岁男孩身高均数为123.02cm,标准差为4.79c
12、m,试估计(1)该地8岁男孩身高在130cm以上者占该地8岁男孩身高的百分比?(2)身高120cm128cm者占该地8岁男孩总数的百分比?(3)该地80%的男孩身高集中在哪个范围?解(1)已知 所以查附表1,可知u所对应的概率为0.9279,所以身高在130以上者所占概率为1-0.9279,即7.21%。(2)即求(-0.63,1.04)区间的面积。查表求得概率(面积)为:0.5865130,123.02,4.79xcm xcm scm130123.021.464.79xxus11221 2 01 2 3.0 20.6 34.7 91 2 81 2 3.0 21.0 44.7 9xxusxxu
13、s (3)已知概率p=0.80,求x值。根据正态曲线下面积为1以及分布的对称性,所以可知区间 的概率为0.9,而区间 的面积为0.1,所以通过查表知 同理,求得 故所求的区间为(117.39,128.65)。11(,),uu为负值2(,)u121.28,1.28uu 1111123.02,1.284.79117.39xxxusx 所以有:2128.65x正态分布理论在制定考核标准研究中的应用正态分布理论在制定考核标准研究中的应用 制定考核标准前应获取建标数据并求得其平均数和标准差,确定各等级人数的百分比。一、制定考核标准的步骤一、制定考核标准的步骤1.制定正态曲线的分布草图;2.计算出从 到各
14、ui值所围成的面积(概率);3.查表求各等级的ui;4.求各等级标准的原始成绩 。ix正态分布理论在人数估计研究中的应用正态分布理论在人数估计研究中的应用估计人数的步骤:估计人数的步骤:v作一个正态分布草图,以确定估计范围;v计算估计范围的 值;v查表找到估计范围的面积(概率);v计算估计范围的人数。例3:已测得某大学女生的仰卧起坐成绩的平均数为34个,标准差为3个,原始变量基本呈正态分布,该学校的女生共3000人,现要分别估计仰卧起坐成绩在40个以上、37个到40个、33个到37个,28到33个,28个以下的人数。iu第一步:作正态分布草图(见图15)。图图 1515第二步:求各区间的 值。
15、在查表前,要将原始的一般正态分布改造成标准正态分布。根据改造公式,可求得:所以要估计的5个区间分别为:iu1212343428 3433 342,0.333337 3440 341,2,33xxxxuussxxxxuuss(,2),2,0.33),0.33,1),1,2),2,)第三步:根据各 值求各区间的面积(概率)。查正态分布表,可知:所围成的面积为:0.0228 所围成的面积为:0.3479,所围成的面积为:0.4706,所围成的面积为:0.1359,所围成的面积为:0.0228第四步:求各区间的人数。40个以上的人数=3000 x0.0228=68人,iu(,2)0.33,1)2,0.
16、33)1,2)2,)37个到40个的人数=3000 x0.1359=408人;33个至37个的人数=3000 x0.4706=1412人;28个至33个的人数=3000 x0.3479=1044人;28个以下的人数=3000 x0.0228=68人。正态分布理论在制定离差评价表中的应用正态分布理论在制定离差评价表中的应用一、制定离差评价表的步骤:一、制定离差评价表的步骤:1.根据指标总数画好框表;2.将各指标的平均数 填入框表中表示均数的等级线与各指标线的交叉处;3.计算各指标的 或 并填在各指标线与各等级线交叉处。4.将各个体不同时期各指标值分别填在表中。ix2iiixsxs和0.51.5i
17、iixsxs和1641599.610.455 60850 55415411.245 5001491240 44614412.835 392身高身高铅球铅球60m60m体重体重xx+2+2sx-2s-2sx+s+sx-s-s张娜在学期前后各项得分依次为:张娜在学期前后各项得分依次为:152152,11.611.6,4747,510510;154154,11.311.3,5050,540540正态分布理论统一变量单位在综合评价中的应用正态分布理论统一变量单位在综合评价中的应用(一一)综合评价模型综合评价模型 综合型评价模型是指根据一定的目的,采用合理的方法,从多角度(或多因素)衡量被判别事物的价值
18、和水平的过程。1.平均型综合评价模型平均型综合评价模型 该模型对被判别事物的所有构成指标的得分平均,得到综合评价值W,其数学模型为:2.加权型综合评价模型 该模型是将被判别事物所有的评价指标的得分与其各自权重乘积的和作为综合评价值W。其数学模型为:1/,(1,2,)niiiWx nWnxin式中为综合评价值 为评价指标的个数为各评价指标的数值。11(1)nniiiiiWk xkki式 中为 各 评 价 指 标 的 权 重。例:已知一群跳远运动员的4个指标为:跳远成绩 纵跳 。现有两名运动员的上述4项指标水平为4项指标的权重为:用加权平均型综合模型评价两运动员的能力。1126.1,0.12;30
19、2.9,xm smxs米跑23340.1;80,3;100ssxcm scmxkg纵跳大腿力量44skg123412346.3,2.8,84,1056.4,2.7,83,95xm xs xcm xkgxm xs xcm xkg甲;乙。12340.3,0.3,0.2,0.2,kkkk(二)几种统一变量单位的方法(二)几种统一变量单位的方法 U分法 等距升分 Z分法 累进记分法 不等距升分 百分位数法 变量非正态分布 1.U分法分法 将原始变量转换成标准正态分布的横轴变量的方法。计算公式为:2.Z分法分法 计算公式为:“+”在变量水平高数值也大时用,“-”在变量水平低而数值大时用。xxus5010
20、05010066uxxZs3.累进记分法 累进记分的分数与运动成绩提高的难度相适应,其计算公式为:D变量的转换公式为:2kykDZZD为难度系数,为变量,为常数。55,55xxDuSxxDuS(适 用 于 田 赛 项 目)(适,用 于 径 赛 项 目)例(累进记分方法):某班跳远成绩 求5.4m和5.7m的原始数据的累进分数。15.5,0.12.82.8100 xm smxsxs,若以为起分点(0分),为满分点(分),v求解起分点和满分点对应的D值。v建立累进记分方程。v求解原始分数的D值。11225.45.55540.15.75.55570.1xxDSxxDS2202.21007.8kZkZ
21、21.798.66yDv求累进记分值。v累进记分法的计算步骤:1.用公式求解起、满分点对应的D值;2.求解方程组,k和z值,即得累进记分方程。3.用公式求原始分数的D值。4.根据累进记分方程求累进记分值。21221.7948.6619.981.7978.6679.05yy111255xxDSxxDS4.百分位数法百分位数法百分位数法计算公式为:100iixxn(组下限)组内数组前累计频数组距成绩百分位数本章重点v标准正态分布的性质及转换过程。标准正态分布的性质及转换过程。v正态分布表的使用和计算正态分布表的使用和计算v正态分布理论的应用。正态分布理论的应用。v问:如果我得出一个概率为P(|z|
22、2)我该怎样去查正态分布表?v答:不妨设随机变量Z服从正态分布N(a,b),a是其均值,b是其方差。令Z=(Z-a)/sqrt(b),其中sqrt()为开方。这样,Z就变成了服从标准正态分布N(0,1)的随机变量。举俩例子吧。例一、Z服从N(0,1)。求P(|Z|2)。由于Z已经服从标准正态分布N(0,1),那么Z=Z,不必转化了。P(|Z|2)=P(Z2)+P(Z=-2)=2*P(Z2)=2*(1-P(Z=2)v查表可知,P(Z=2)=0.9772,所以P(|Z|2)=0.0456。注意:所谓的正态分布表都是标准正态分布表(N(0,1),通过查找实数x的位置,从而得到P(Z=x)。表的纵向代
23、表x的整数部分和小数点后第一位,横向代表x的小数点后第二位,然后就找到了x的位置。比如这个例子,纵向找2.0,横向找0,就找到了2.00的位置,查出0.9772。例二、Z服从N(5,9),求P(Z11)+P(Z=-1)。令Z=(Z-5)/3,Z服从N(0,1)做转化P(Z11)+P(Z=-1)=P(|Z-5|6)=P(|Z|2)到此,你可能也看出来了,通过转化,例二和例一实际是一样的。剩下的计算,请你在不看例一解答的情况下,自己做一遍吧。加深印象,呵呵。v谢谢3楼的兄弟,谢谢你!不过还有点没明白,就是:查表可知,P(Z=2)=0.9772,所以P(|Z|2)=0.0456。为什么?0.0456
24、是怎么得出来得呢?=前面已经推导出 P(|Z|2)=P(Z2)+P(Z=-2)=2*P(Z2)=2*(1-P(Z=2)代入P(Z=2)=0.9772 算出P(|Z|2)=2*(1-0.9772)=0.0456v如果分布函数是标准正态分布的话,直接查表就可以了.标准正态分布图关于y轴对称。P(|z|2)=2*1-P(z=2)P(z=2)就是表中2对应的值 如果不是标准正态分布,首先你要知道这个正态分布的分布函数,也就是知道它的均值和方差,然后把它划为标准正态分布。v如果z服从分布N(,),那么查P(z=2)就要换成标准正态分布,(z-)/,查表可得所求值.分析:题中所列各项目的单位并不相同,所以
25、首先需要将其标准化,可采用U分法或Z分法将各项目的单位统一。本题采用U分法统一单位:可得到甲乙两运动员的U分各为:甲:U1=5/3,U2=-1,U3=4/3,U4=5/4;乙:U1=5/2,U2=-2,U3=1,U4=-5/4;各指标的权重系数为:0.3,0.3,0.2,0.2xxUs又由加权平均型综合评价模型的数学公式为:又由加权平均型综合评价模型的数学公式为:15/30.3(1)0.34/30.25/40.25/30.3(2)0.31 0.2(5/4)0.2niiiWk xWW 甲乙所以,甲、乙及整体的综合能力为:=0.71=0.1 从W值可一看出,甲优于乙,尽管乙运动员前两项指标上要优于甲,而且优于整体水平,乙的综合能力低于整体水平。在学完本节后,请用Z分法统一变量单位再做一遍,看结论是否相同?