1、第4章 概率及其分布 自然界和人类社会中存在着两类现象:必然现象与随机现象必然现象与随机现象。必然现象必然现象就是指在一定条件下必然发生的现象。如在标准大气压下,水加热到100必然会沸腾;抛出的物体其初速度只要小于第一宇宙速度,必然会落回地面等,这些现象都是必然现象。随机现象随机现象是指在一定条件下有时发生有时不发生的现象。如往地面掷一枚硬币,“出现正面”这一现象有时发生,有时不发生;篮球投篮中“投中”这一现象有时发生有时不发生,这些都是随机现象。14.1 随机事件及其概率随机事件及其概率一、随机事件一、随机事件对随机现象进行观察,会观察到不同的结果,如观对随机现象进行观察,会观察到不同的结果
2、,如观察掷硬币这一随机现象就可能看到察掷硬币这一随机现象就可能看到“出现正面出现正面”或或“出出现反面现反面”这两种不同的结果,这两种不同的结果,“出现正面出现正面”是掷硬币这是掷硬币这一随机现象的一种观察结果,我们称之为随机事件,同一随机现象的一种观察结果,我们称之为随机事件,同样样“出现反面出现反面”也是随机事件。也是随机事件。随机事件随机事件:对随机现象进行观察,其观察结果叫随:对随机现象进行观察,其观察结果叫随机事件,简称事件机事件,简称事件,用大写英文字母用大写英文字母A、等表示。、等表示。作为随机事件的特例,若某事件在每次试验中总是作为随机事件的特例,若某事件在每次试验中总是发生,
3、则称该事件为发生,则称该事件为必然事件必然事件,一般用字母,一般用字母表示;反表示;反之若某事件在每次试验中都不发生,则称该事件为之若某事件在每次试验中都不发生,则称该事件为不可不可能事件能事件,一般用字母,一般用字母表示。表示。2二、随机事件的概率二、随机事件的概率 1.频率频率在相同的条件下,进行了在相同的条件下,进行了n次试验,在次试验,在这这n次试验中事件次试验中事件A出现了出现了m次,则称比值次,则称比值m/n为事件为事件A的频率,记为的频率,记为F(A)=m/n。显然任一事件显然任一事件A都有都有0F(A)13452.概率概率随机事件的概率随机事件的概率:在在n次重复试验中随机事件
4、次重复试验中随机事件A发发生的次数记为生的次数记为m,当,当n很大时,频率很大时,频率m/n会稳定地在某一会稳定地在某一数值数值p的附近摆动,而且随着试验次数的附近摆动,而且随着试验次数n的增加,其摆的增加,其摆动的幅度越来越小,称动的幅度越来越小,称p为随机事件为随机事件A的概率的概率,记为:,记为:P(A)=p例如,在投硬币的试验中,例如,在投硬币的试验中,“出现正面出现正面”这一随这一随机事件发生的频率在机事件发生的频率在.附近摆动,且随着试验次数附近摆动,且随着试验次数的增多摆动的幅度会越来越小,因此,可以认为的增多摆动的幅度会越来越小,因此,可以认为“出现出现正面正面”这一随机事件的
5、概率为这一随机事件的概率为.。6而对不可能事件而对不可能事件 必有必有m=0,对必然,对必然事件事件 一定有一定有m=n,可知它们的频率为,可知它们的频率为F()=1,F()=0对概率类似地有对概率类似地有0P(A)1以及以及P()=1,P()=07893.小概率事件原则小概率事件原则一般若一般若P(A)0.05,则称事件,则称事件A为为小概率事件。小概率事件。小概率事件在一次试验中可看作不可小概率事件在一次试验中可看作不可能事件,认为不可能发生,这一原则称之能事件,认为不可能发生,这一原则称之为小概率事件原则。小概率事件原则是统为小概率事件原则。小概率事件原则是统计推断的重要原则,在以后的学
6、习中将会计推断的重要原则,在以后的学习中将会多次用到此原则。多次用到此原则。104.2 随机变量及其概率分布随机变量及其概率分布一、随机变量一、随机变量当用一个变量的取值来表示随机试验当用一个变量的取值来表示随机试验的结果时,该变量随着试验的不同结果而的结果时,该变量随着试验的不同结果而取不同的值,也就是说变量的取值是随机取不同的值,也就是说变量的取值是随机的,称此变量为的,称此变量为随机变量随机变量,随机变量一般,随机变量一般用大写英文字母用大写英文字母X、Y、Z表示,也可以表示,也可以用用、等表示。等表示。11二、随机变量的概率分布1.概率分布的概念概率分布的概念概率分布:概率分布:随机变
7、量的取值及取值的概率称为随机变量的概率分布。2.概率分布的表示方法概率分布的表示方法 分布列法 分布曲线法12例如:例如:6X8的概率(即该运动员命中6至8环的概率)为:P(6X8)=0.14+0.3+0.35=0.7913例例4-2 某一不透明的盒中装有某一不透明的盒中装有1010个外形一样的个外形一样的球,其中球,其中5 5个黑球,个黑球,5 5个白球,现从中任取个白球,现从中任取3 3球,球,用用Y Y表示取到的白球数,求表示取到的白球数,求Y Y的概率分布列。的概率分布列。分析:求分析:求Y的概率分布列,就是求的概率分布列,就是求Y能取哪能取哪些值及取这些值的概率。些值及取这些值的概率
8、。解解:由于取出的由于取出的3个球中可能有个球中可能有0个白球,个白球,1个白球,个白球,2个白球,个白球,3个白球,因此个白球,因此Y的的取值范围为取值范围为0、1、2、3。1415概率密度曲线概率密度曲线的含义:概率密度曲线与轴、直线、直线所组成的曲边梯形的面积等于随机变量的取值落在区间,内的概率。164.3 几种常用的概率分布几种常用的概率分布一、两点分布一、两点分布二、二项分布二、二项分布 贝努里试验:一般地,如果在相同条件下进行了贝努里试验:一般地,如果在相同条件下进行了n次相互独立的试验,每次试验只有两个可能的结果:次相互独立的试验,每次试验只有两个可能的结果:A或或 ,且,且P(
9、A)=p,相应地,相应地P()=q=1-p,则称这样,则称这样的的n次试验为次试验为n重贝努里试验。重贝努里试验。knkknppCkXP)1()(AA(k=0,1,2,n)1718例例4-6 不透明盒中装有不透明盒中装有100只外形一样的球,只外形一样的球,其中其中10个白球,个白球,90个红球,采用有放回取球个红球,采用有放回取球方式,从中任取方式,从中任取5球,求恰好取到球,求恰好取到3个白球的个白球的概率。概率。解:将取一个球看作一次试验,取个球相当解:将取一个球看作一次试验,取个球相当于做了重贝努力试验,用表示取到的白于做了重贝努力试验,用表示取到的白球数,显然是球数,显然是n=5,p
10、=0.1的二项分布,恰的二项分布,恰好取到个白球就是,由二项分布可好取到个白球就是,由二项分布可知其概率为:知其概率为:0081.0)1.01(1.0)3(35335CXP19三、正态分布三、正态分布(一)(一)正态分布的概念正态分布的概念正态分布是实践中最为常见的一种分布,正态分布是实践中最为常见的一种分布,如同年龄、同性别人的身高、体重、运如同年龄、同性别人的身高、体重、运动成绩等都服从正态分布。动成绩等都服从正态分布。222)(21xey20立定跳远3.03-3.082.93-2.982.83-2.882.73-2.782.63-2.682.53-2.582.43-2.482.33-2.
11、382.23-2.282.13-2.18频数6005004003002001000Std.Dev=.14 Mean=2.60N=3877.0021记为记为X(,),其对应的曲线叫正态曲线),其对应的曲线叫正态曲线。22正态曲线有以下性质:曲线在轴上方,以曲线在轴上方,以为其对称轴,当为其对称轴,当时,函数时,函数F(X)有最大值,正有最大值,正态曲线达到最高点。态曲线达到最高点。,为正态分布的两为正态分布的两个参数,个参数,确定曲线的中心位确定曲线的中心位置,如图置,如图4-5所示,所示,确定曲确定曲线的形状,线的形状,愈大,曲线愈扁愈大,曲线愈扁平。平。曲线与轴所围面积曲线与轴所围面积为为。
12、2324(二)标准正态分布及其概率计算(二)标准正态分布及其概率计算正态分布中正态分布中,取一组特殊值:取一组特殊值:=,=,这时的正态分布称为标准正态分布,这时的正态分布称为标准正态分布,记为记为N(0,1),其概率密度函数为:),其概率密度函数为:2x2e21y25标准正态分布中,随机变量标准正态分布中,随机变量X落在区间落在区间(a,b)内的概率就等于分布曲线、内的概率就等于分布曲线、X轴及轴及X=a,X=b所围所围图形的面积图形的面积。26下面介绍利用标准正态分布表,求X取值于各区间的概率的方法。(1)已知,求(已知,求(X)?)?例例4-7已知X(0,1),求(X1.17)?27(2
13、)已知,求(已知,求(X)?)?例例4-8 已知X(,),求(X1.17)=?28(3)已知、,求(axb)?例例4-9 已知XN(0,1),求(-1X1)?。29(4)已知(已知(Xa)P,求,求a?例例4-10 已知(Xa)0.8485,求a?(5)已知(已知(Xa)P,求,求a?例例4-11 已知(XA)0.8251,求A?30(三)、非标准正态分布及其概率计算1.标准化公式标准化公式设设XN(,),则:),则:称公式称公式 为标准化公式。为标准化公式。)1,0(NXuXu312.非标准正态分布概率的计算非标准正态分布概率的计算例例4-12 已知XN(10,9),求(X13)?32例例4
14、-13 已知X(10,4),求(X7)?33(X )0.6826(2X2)0.9544(3X3)0.997434354.4 正态分布的应用4.4.1 制定考核标准制定考核标准例例4-18铅球考核中成绩服从正态分布,且平均成绩=7.21,标准差0.9,若要使20的学生成绩达到优秀,35的学生成绩达到良好,35的学生成绩达到及格,试问如何制定各级别的标准?36【解】【解】()如图()如图4-18所示,要求所示,要求20的学生成绩达到优秀,就的学生成绩达到优秀,就是求,使是求,使()()0.2 ()()0.20.8又查标准正态分布表知:(又查标准正态分布表知:(0.84)0.79950.80由标准化
15、公式得:(由标准化公式得:(7.21)0.90.840.840.97.218.0(米)(米)37()如图()如图4-18所示,要求所示,要求35的学生成绩达到良好,就的学生成绩达到良好,就是求,使是求,使 ()()0.20.350.55 ()()10.550.45又查标准正态分布表知:又查标准正态分布表知:P(0.13)=0.44830.4由标准化公式得:(由标准化公式得:(7.21).0.130.130.97.217.10(米)(米)38()如图()如图4-23所示,要求所示,要求35的学生成绩达到及格,就的学生成绩达到及格,就是求,使是求,使 ()()0.20.350.350.90()()
16、10.900.1又查标准正态分布表知:(又查标准正态分布表知:(1.28)0.10030.10由标准化公式得:(由标准化公式得:(7.21).-1.280.97.216.06(米)(米)综上所述,优秀标准应为综上所述,优秀标准应为.0m,良好标准应为,良好标准应为7.10m,及,及格标准应为格标准应为6.06m。394.4.2 估计实际分布情况估计实际分布情况例例4-19 设高中男生身高设高中男生身高X(单位:厘米)是正态变量,均值(单位:厘米)是正态变量,均值是是171,标准差是,标准差是4,即,即XN(171,42)。求:。求:(1)身高超过身高超过175的学生所占的比例;的学生所占的比例
17、;(2)身高在身高在165至至175之间学生所占的比例;之间学生所占的比例;(3)以均值以均值171为中点的一个区间,使其学生占为中点的一个区间,使其学生占95%。404.4.3 统一计分标准统一计分标准 414.4.4累进计分累进计分 体育运动中许多项目成绩的提高体育运动中许多项目成绩的提高与分数的增加不应该是等比例的,比与分数的增加不应该是等比例的,比如如100米跑的成绩,每提高米跑的成绩,每提高0.1秒,所加秒,所加的分数不应相等,因为水平愈高每提的分数不应相等,因为水平愈高每提高高0.1秒的难度也愈大,相应增加的分秒的难度也愈大,相应增加的分数也应愈多。数也应愈多。42练习题练习题1.
18、某一不透明的盒中装有某一不透明的盒中装有10个外形一样的球,其中个外形一样的球,其中5个黑球,个黑球,5个白球,现从中任个白球,现从中任取取5球,用球,用X表示取到的白球数,求表示取到的白球数,求X的概率分布列。的概率分布列。2已知已知XN0,1求:求:(1)P(X1.35)?(2)P(X-1.78)?(3)P(-1.751.85?3已知已知XN0,1若若P(Xb)0.1515,求求b=?4已知已知X175,52求:求:(1)P(180)?)?(3)P(175185)?)?5.已知已知XN100,102(1)若若P(Xb)0.1515,求求b=?6某年级学生某年级学生280人,跳远平均成绩为人
19、,跳远平均成绩为5.00米,标准差为米,标准差为0.4米,现规定米,现规定4.5米及格,米及格,试估计有多少学生不及格(设跳远成绩服从正态分布)。试估计有多少学生不及格(设跳远成绩服从正态分布)。437某年级学生某年级学生100米跑平均成绩为米跑平均成绩为14.7秒,标准差为秒,标准差为0.7秒,如果秒,如果要求要求10%的人得优秀,的人得优秀,30%得良好,得良好,8%不及格,问优秀、良好、不及格,问优秀、良好、及格的标准应为多少秒。及格的标准应为多少秒。8若跳高成绩服从正态分布,其平均数为若跳高成绩服从正态分布,其平均数为1.5米,标准差为米,标准差为0.08米。米。现规定现规定20%的学
20、生可评优秀。问至少跳多高才能获得优秀。的学生可评优秀。问至少跳多高才能获得优秀。9测得某年级学生跳远成绩服从正态分布,其平均数为测得某年级学生跳远成绩服从正态分布,其平均数为5.0米,标米,标准差为准差为0.2米,米,(1)若要求若要求90%的学生达到及格,问及格的标准应为多少米?的学生达到及格,问及格的标准应为多少米?(2)若成绩在若成绩在4.8米至米至5.2米之间有米之间有50人,问参加跳远的学生有多少人?人,问参加跳远的学生有多少人?10某年龄组跳远平均成绩是某年龄组跳远平均成绩是3.2米,标准差是米,标准差是0.20米,试计算跳米,试计算跳远成绩为远成绩为3.45米和米和3.12米的标准百分各是多少。米的标准百分各是多少。44