1、 第二节 概率的定义及其确定方法1.概率的定义2.求概率的频率方法3.求概率的古典方法4.求概率的几何方法1.概率的定义 事件的概率,通俗地讲,是指该事件发生可能性大小地度量.在历史上,由于随机试验及随机事件的类型很多,人们也就从不同侧面用不同方式研究了如何度量事件发生的可能性.例如,研究女婴出生的概率,瑞典人通过大量观察,测得女婴出生的频率在0.482左右波动,得出女婴出生的概率约为0.482.再如,掷两颗骰子获得双6的概率,通过简单理论推算知道,其严格等于1/36.所以,概率研究的情形很多,也相应产生了一些特殊的计算方法.但如何对概率给出一个一般性的如何对概率给出一个一般性的定义定义,使得
2、这些特殊的计算方法得出的概率均符合这个一般性的定义?通过对各种概率问题的深入研究,抽象出概率的一般特征(这种研究方法常称为弱抽象),伟大的数学家,现代概率论奠基者,柯尔莫哥柯尔莫哥洛夫洛夫(Kolmogorov)提出了概率的公理化的定概率的公理化的定义义,引领了现代概率论的发展.概率的公理化定义(或称柯尔莫哥洛夫公理):设为样本空间,F 为上的一个事件域.如果对任一事件AF,定义在F 上的实值函数P(A)满足0P(A),A:)1(F对于任意对于任意非负性非负性1)P(:)2(正则性正则性 1ii1iin21)P(AA P ,A,A,A:)3(有有互不相容互不相容若若可列可加性可列可加性则称P(
3、A)为事件A的概率,称(,F ,P)为概率空间.概率的定义并没有告诉人们如何去求概率,也没有说一个特定的样本空间对应一个特定的概率,只是告诉人们以任何方式定义的概率必须满足的条件.概率的求法,根据问题的特点,分别采取以下的不同途径进行:频率方法频率方法 古典方法古典方法 几何方法几何方法2.求概率的频率方法事实上,人们很早就开始了这方面的思考.例如,“频频率率”早就被引入来描述事件发生的频繁程度.为了研究女婴出生的可能性,统计学家克拉梅(1893-1985)利用瑞典1935年的官方资料,测得女婴出生的频率在0.482左右摆动,从而得出女婴出生的概率为0.482.频率(Frequency)的定义
4、:设随机事件A在n次试验中出现nA次,则事件A在n次试验中发生的频率为nnAfAn)(频率的性质频率的性质:1)(0 ,A)1(Afn对任意事件对任意事件1)(,)2(SfSn对必然事件对必然事件易知,随机事件的频率具有以下性质:)()()()(,k,)3(21211knnnknkAfAfAfAAAfAA 则则个互不相容事件个互不相容事件是是若若直觉告诉我们,事件的频率应能在一定程度上反映事件发生的可能性大小.因为如果事件发生的可能性大,它在n次试验中出现的机会也多,事件发生的频率就大些.但是,频率也有明显的缺陷明显的缺陷:随机事件的频率fn(A)随着试验总次数n的不同而不同,这种波动性在n较
5、小时较为明显,这就为频率作为一个潜在的衡量事件发生可能性的指标蒙上了阴影.为了证明这种说法,我们考虑“抛硬币抛硬币”的试的试验验:将一枚硬币抛5次,50次,500次各做10遍,得到的数据如下表.试验序试验序号号n=5n=50n=500nHn(H)nHn(H)nHn(H)1234567891023151242330.40.60.21.00.20.40.80.40.60.6222521252421182427310.440.500.420.500.480.420.360.480.540.622512492562532512462442582622470.5020.4980.5120.5060.50
6、20.4920.4880.5160.5240.494从上表也可以看出一些好消息,在在n较大时较大时,事件的频率表现事件的频率表现出一定的稳定性出一定的稳定性:即随着n的增大,fn(A)越来越趋近于一个常数.历史上许多人投掷硬币实验的结果也证实了这点.实验者nnHfn(H)德摩根204810610.5181蒲丰404020480.5069卡.皮尔逊1200060190.5016卡.皮尔逊24000120120.5003概率的频率化定义:当与随机事件有A关的随机试验可大量重复进行时,如进行n次.当n很大时,事件A出现的频率 fn(A)=nA/n 将稳定地在某一数值p附近摆动,且一般随试验次数n的增
7、大,摆动的幅度也越来越小,则称该数值p为事件A发生的概率,记为P(A)=p这种大量重复试验中事件出现的频率的稳定性表明,随机事件发生的可能性大小是随机事件本身所固有的客观属性,我们用这个频率的稳定值来表示事件发生的可能性大小是合理的,这就是概率的频率化定义.容易验证,通过频率法定义的概率满足概率的公理化定义,实际上,我们只要验证频率满足那三条性质.求概率的频率方法的最大优势最大优势在于它让我们能够求得通过理论方法无法无法求得的概率.现在我们来看两个例子:例一例一(女婴出生率的研究女婴出生率的研究).拉普拉斯在18世纪末对伦敦,彼得堡,柏林和法国的众多统计资料进行研究,发现这些国家的女婴出生率都
8、稳定地接近于0.488.统计学家克拉梅(1893-1985)用瑞典1935年地官方资料(见下表),发现女婴出生频率总是在0.482左右波动.例二例二(被闪电击中概率的研究被闪电击中概率的研究).如何求一个人在某年中被闪电击中的概率?中国1.1109人中,在2005年被闪电击中的人数为3300人,通过概率的频率方法我们知道,某人被闪电击中的概率为69103101.13300 频率方法的最大缺点缺点是必须进行大量的重复试验.在无法进行大量的重复试验时,要获得频率的稳定值是比较困难的.因此,在很多情形下,常通过如下的严格的严格的数学推导方法数学推导方法(即古典方法和几何方法),以获得概率的准确值准确
9、值.3.求概率的古典方法原理:古典方法适应于样本空间只有有限个样本点,而且每个样本点的出现是等可能的情形.n1)P()P(,;,n21n21 即即样本点等可能样本点等可能同时设每个同时设每个即即个样本点个样本点有有若若,A,mAm21iii 不妨记为不妨记为个样本点个样本点有有如果事件如果事件nm n1n1n1 )P()P()P(P(A)m21iii 性有性有则根据概率的可列可加则根据概率的可列可加nmAP(A):中所含的样本点数中所含的样本点数中所含的样本点数中所含的样本点数概率的古典计算公式概率的古典计算公式所以得到所以得到在应用古典方法计算概率时,最大的难点最大的难点在于确在于确 定定和
10、和A A中的样本点数中的样本点数,之所以难的原因在于这里面往往涉及很多排列排列组合组合的计算.例三例三.在标有1至10的十个同样的球中,任取一球,求取到的球的标号是不超过6的偶数的概率.解解:将每个不同的球作为样本点,则样本空间含有10个样本点,且由于是任取,每个样本点是等可能的,所以这是一个古典概型问题.以A表示取到的球是不超过6的偶数,则A=2,4,6.故P(A)=m/n=3/10=0.3例四例四.设有N件产品,其中D件次品,从中任取n件,求其中恰有k(kD)件次品的概率.nNCn ,N:样本点数就是方式数样本点数就是方式数方式方式件的不同件的不同个产品中取个产品中取样本空间就是从样本空间
11、就是从解解:,通过两个步骤完成通过两个步骤完成这个事件可以这个事件可以件次品件次品个产品中有个产品中有所求事件是所求事件是knkDC ,kD)1(方式数为方式数为件件件次品里取件次品里取从从knDNCkn ,DN)2(方式数为方式数为件件个正品中取个正品中取从从knDNkDCC ,为为所求事件实现的方式数所求事件实现的方式数所以根据乘法原理所以根据乘法原理因此所求事件的概率为因此所求事件的概率为nNknDNkDCCC 例五例五.袋中装有4只白球和2只红球.从袋中摸球两次,每次任取一球.有两种方式:(a)放回抽样;(b)不放回抽样.求:(1)两球颜色相同的概率;(2)两球中至少有一只白球的概率.
12、解解:(:(a)a)放回抽样放回抽样 故P(A)=(44)/(6 6)0.444,P(B)=(22)/(6 6)0.111,则P(AB)=P(A)+P(B)0.556,P(C)=1-P(B)0.889样本空间:取两次球,共有6 6种取法.定义事件定义事件:A=“两球都是白球两球都是白球”,共有共有4 4 种取法种取法,B=“两球都是红球两球都是红球”,共有共有2 2 种取法种取法,C=“两球中至少有一只白球两球中至少有一只白球”,则则AB=“两个球颜色相同”,BC 事件(b)(b)不放回抽样不放回抽样.5612P(B),5634)(AP样本空间样本空间:第一次有6种取法,第二次有5种取法,共有
13、6 5种取法.事件事件A的样本点的样本点:第一次有4种取法,第二次有3种取法,共有43种取法.事件事件B的样本点的样本点:第一次有2种取法,第二次有1种取法,共有21种取法.则P(AB)=P(A)+P(B)=7/15,P(C)=1-P(B)=14/15例六例六.(分房问题分房问题,类比于教材中例类比于教材中例1.2.6的盒子模型的盒子模型)设有n个人,每个人都等可能地被分配到N个房间中的任一间去住(nN),求下列事件的概率(1)指定的n个房间各有一个人住(2)恰好有n个房间,其中各住一个人解解:将将n个人分配到个人分配到N个房间去个房间去,相当于对每个人相当于对每个人,我们从我们从N个房间中抽
14、一个房间让其住个房间中抽一个房间让其住,而且这种抽样是放回式而且这种抽样是放回式的的,即不同的人可以住同一房间即不同的人可以住同一房间,所以抽法总数为所以抽法总数为 Nn.又因为这里不同的分配法组成了题目的样本空间又因为这里不同的分配法组成了题目的样本空间,且且每个样本点等可能每个样本点等可能,所以这是一个古典概型问题所以这是一个古典概型问题.(1)因指定的n个房间各有1个人住,所以其不同住法是n个人的全排列 n!,所以要求的概率nNnP!1 样本空间中的样本点数样本空间中的样本点数事件中的样本点数事件中的样本点数(2)这个事件可以通过两个步骤来完成:步骤一步骤一:从从N中任取中任取n个房间个
15、房间;步骤二步骤二:将将n个人排列到个人排列到n个房间中去个房间中去,每房间一个每房间一个人人.nnNNnCP!2 样本空间中的样本点数样本空间中的样本点数事件中的样本点数事件中的样本点数.!,种种该事件实现的方式有该事件实现的方式有所以根据乘法原理所以根据乘法原理nCnN分房模型在统计物理学里也有应用.在那里将本例中的“人人”理解成理解成“粒子粒子”,“房间房间”理解成不同理解成不同的的“能级能级”.例七例七.(生日问题生日问题)某班级有n个人(n365),问至少有两个人的生日在同一天的概率有多大?解解:假定一年按假定一年按365天计算天计算,把把365天当作天当作365个个“房间房间”,那
16、么问题类比于例五那么问题类比于例五.这时这时,事件事件“n个人生日全不相同个人生日全不相同”就相当于例五中就相当于例五中的的(2):“恰有恰有n个房间个房间,其中各住一人其中各住一人”.令令A=n个人中至少有两个人的生日在同一天个人中至少有两个人的生日在同一天,则其则其对立事件是对立事件是n个人的生日全不相同个人的生日全不相同.根据例五根据例五(2)知知nnnnNnCNnCAP365!)(365 所以所以,nnnnNnCNnCAP365!1!1)(365 这个例子就是历史上著名的这个例子就是历史上著名的“生日问题生日问题”,对一些对一些n值,值,计算出相应的计算出相应的P(A)如下表如下表:n
17、102023304050P(A)0.12 0.41 0.51 0.71 0.89 0.97上表所列的答案是出乎很多人意料的上表所列的答案是出乎很多人意料的,因为因为”一个班一个班级至少有两个人生日相同级至少有两个人生日相同”的概率的概率,并不如大多数人并不如大多数人直觉中想象的那样小直觉中想象的那样小,而是相当大而是相当大.这个例子告诉我这个例子告诉我们们,“直觉直觉”有时并不可靠有时并不可靠,这就说明研究随机现象这就说明研究随机现象统计规律的重要性统计规律的重要性.4.求概率的几何方法原理:前面我们讨论了古典概型的概率问题前面我们讨论了古典概型的概率问题.在古典概型中在古典概型中,我们要我们
18、要求样本空间的样本点数只能是有限多个求样本空间的样本点数只能是有限多个,这给许多实际问这给许多实际问题的解决带来了很大限制题的解决带来了很大限制.有时有时,我们必须考虑试验结果即我们必须考虑试验结果即样本点有无限多个样本点有无限多个的随机现的随机现象象.例如例如,向平面上一有限区域向平面上一有限区域S任意投点任意投点,求点在求点在S内的小内的小区域区域G中的概率中的概率.将该例拓展到一般情形将该例拓展到一般情形,我们说有一类随机现象我们说有一类随机现象,它有两个特它有两个特点点:在这种几何概型下在这种几何概型下,定义任意事件定义任意事件A的概率为的概率为(1)随机试验的样本空间随机试验的样本空
19、间对应于一个几何区域对应于一个几何区域S,S,使得使得样本点与样本点与S S中的点一一对应中的点一一对应.此时此时,试验的任一事件必与试验的任一事件必与S S内的某一区域内的某一区域G G相对应相对应.(2)任意事件任意事件A的概率只与其对应区域的概率只与其对应区域G的量度的量度(如长度如长度,面积面积,体积体积)成正比成正比,而与而与G的所在位置无关的所在位置无关.的度量的度量的度量的度量SGAP)(例七例七.从区间0,1内任取两个数,求这两个数的乘积小于1/4的概率.解解:以以x,y表示从区间表示从区间0,1中任取的两个数中任取的两个数,则则x,y的可能的可能变化范围为变化范围为 0 x
20、1,0 y 1.现建立直角坐标系现建立直角坐标系xoy如下图如下图,0 xy11GS则则(x,y)的样本空间对应于图中边长为的样本空间对应于图中边长为1的正方形区域的正方形区域S,而我们所关心的事件而我们所关心的事件A=0,1中任取的两个数之积小于中任取的两个数之积小于1/4发生的充要条件是发生的充要条件是 0 x,y 1,xy1/4这对应于图中的阴影部分这对应于图中的阴影部分G,其面积为其面积为 1412ln214141141/dxxG的面积的面积5966.012ln2/14/1SG 的面积的面积的面积的面积故所求事件的概率故所求事件的概率由例七可知:通常在用几何法求概率几何法求概率时,(1
21、)首先选定与问题有关的变量首先选定与问题有关的变量(x,y等等),确定这些变量所有可能的变化区域S;(2)然后用含有这些变量的不等式来表示所关心事件A发生的充要条件,从而得到其对应的区域G;(3)最后G与S的度量的比值就是所求事件的概率.例八例八(会面问题会面问题).甲乙两人约定在下午6时到7时之间在某处会面,并约定先到者应等候另一人20分钟,过时即离去.求两人能会面的概率.解解:以以x,y表示甲乙两人到达的时间表示甲乙两人到达的时间,则则(x,y)对应的样本对应的样本空间是图中边长为空间是图中边长为60分钟的正方形区域分钟的正方形区域S.6点xy7点7点GS事件事件A=两个人能够会面发生的充
22、要条件是两个人能够会面发生的充要条件是|x-y|20,即即图中的阴影部分图中的阴影部分G.222406040402/1260G 的面积的面积95604060SG222 的面积的面积的面积的面积故所求事件的概率故所求事件的概率例八例八(三角形问题三角形问题).在长度为a的线段内任取两点将其分成三段,求它们可以构成一个三角形的概率.解解:以以x,y和和a-x-y表示线段分成的三段长度表示线段分成的三段长度,则有则有0 xa,0ya,0a-(x+y)a所以所以,样本空间对应于区域样本空间对应于区域S=(x,y)|0 xa,0ya,0a-(x+y)a将将S作图在平面直角坐标作图在平面直角坐标系上为三角形系上为三角形AOB区域区域.事件事件A=x,y和和a-x-y 构成三角形发生的充要条件为构成三角形发生的充要条件为8221G22aa 的面积为的面积为.412/8/SG22 aa的面积的面积的面积的面积故所求事件的概率故所求事件的概率 yxaxyyxayxyxyxa00)(0.20 ,20 ,2,ayaxayxa 整理得整理得所以事件所以事件A可用图中得阴影部分可用图中得阴影部分G来表示来表示.本节完1.2 作业教材第28页习题 4,6,23,28