1、概率论基础知识概率论基础知识1.概率论中的基本概念概率论中的基本概念一、随机试验、样本空间和事件一、随机试验、样本空间和事件1.随机试验随机试验:具有两个或两个以上可能的结果,但事先无法确定会出现哪个结果的观察或试验。如投掷一枚硬币可能出现正面或反面;明天的天气可能是阴、晴或雨;每天到达某一商店的顾客数;某商场的月销售额;某时段到达一个电话交换机的呼叫次数,等等,观察或统计这些现象的结果,就是在进行随机试验。2.样本与样本空间样本与样本空间:随机试验可能产生的各个不同结果都称为样本,由所有样本组成的集合称为该随机试验的样本空间,通常记为。3.随机事件随机事件(简称事件事件):样本空间的任一个子
2、集合都称为这个样本空间上的一个随机事件。当随机事件中所含的任何一个样本出现时,便称该事件发生了。注注:(1)整个样本空间作为一个事件,称为必然事件。(2)不含任何样本点的事件(空集)称为不可能事件。例例1.从5件不同的物品a,b,c,d,e 中随机地取出两件,可能的结果有种,每种可能的结果是一个样本。这10个样本构成了样本空间。A=“取出的两件物品中含有a”是这个样本空间上的一个随机事件。例例2.投掷一枚骰子是一个随机试验,其样本空间为:=1,2,3,4,5,6令:A=“出现不大于4的点”,B=“出现小于3的点”。则A、B是上的两个事件:A=1,2,3,4,B=1,2。当投掷结果出现4时,A发
3、生;当投掷结果出现2时,A、B都发生;当投掷结果出现5时,A、B都不发生。255!103!2!C 例例3.某课程考试成绩的样本空间为0,100,对于如下的成绩等级评定表:其五个等级实际上构成了五个互不重叠的事件。它们构成了样本空间的一个划分。分数优秀良好中等及格不及格等级9080,90)70,80)60,70)60二、事件的关系及运算二、事件的关系及运算 设A、B是两个事件。(1)包含关系:若事件A的每个样本点都在事件B中,则称事件B包含事件A,记为A B。此时,A发生必定B发生。(2)相等关系:如果AB 且 BA,则称事件A与B相等,记为A=B。相等的事件所含样本点完全相同。(3)事件的并:
4、由属于事件A和事件B的所有样本点构成的集合称为事件A与B的并。记为AB或A+B。当且仅当事件A、B中至少有一个发生时,AB发生。(4)事件的交:由既属于事件A又属于事件B的样本点构成的集合,称为事件A与事件B的交,记为AB或AB。当且仅当事件A和B同时发生时,AB发生。(5)对立事件:事件A关于样本空间的补集,称为A的对立事件,记为。事件 发生当仅当事件A发生。(6)互不相容事件(互斥事件):若A B=,则称事件A与事件B是互不相容的。互不相容事件不可能同时发生。(7)事件的差:属于事件A 但不属于事件B 的样本点构成的集合,称为事件A与事件B 的差,记为 AB。事件AB 发生当且仅当事件A
5、发生但事件B不发生。注注:三、事件运算的性质三、事件运算的性质(1)交换律:AB=BA,A+B=B+A。(2)结合律:A(BC)=(AB)C,A+(B+C)=(A+B)+C.(3)分配律:(A+B)C=(AC)+(BC),(AB)+C=(A+C)(B+C),;.ABABAA :,:;.ABABABABAAAAAAAAA (4)德摩根律 特别地2.事件的概率事件的概率1.概率的统计定义概率的统计定义:设在n次重复随机试验中,事件A发生了nA次,则称数字 为事件A发生的频率。如果当n无限增加时,频率 在某一常数p附近波动,则称p为事件A发生的概率,记为P(A).2.概率的古典定义概率的古典定义:设
6、某一随机试验的样本空间含有n个样本,所有样本的出现是等可能的,则事件A的概率定义为AnnAnn()AmP An事件 包含的样本数例例4 一批产品共有100件,其中5件次品,现从中任取10件。问(1)全是正品的概率;(2)恰有一件次品的概率;(3)至少有3件次品的概率。10100101001095109510100.(1),()0.5:8CCACACP AC从100件产品中任取10件,共有种取法 每种取法就是一个样本,故样本空间共有个样本令取出的10件全是正品.从含有95件正品的产品中取10件正品的取法有所有可能的取法构成了 的所有样本.故解195951959510100374655595595
7、595359(2)105995,()0.34.(3)103345:,()BBC CC CP BCCCCC CC CC CC CP C令取出的件中恰有1件次品,则其中的1件次品是从 件中取出的,而其中 件正品是从件正品中取出的,故的取法共有因此令取出的件中至少有 件是次品.则恰有 件次品恰有 件次品恰有 件次品.故 所含的样本数为于是746555595595101000.0066.C CC CC3.概率的加法公式概率的加法公式 1.对概率空间的任二事件A、B,有P(A+B)=P(A)+P(B)P(AB)2.若事件A与事件B互不相容(即AB=),则P(A+B)=P(A)+P(B)3.对n个事件A1
8、,A2,An,若Ai Aj=(i j,i,j=1,2,n);则 P(A1+A2+An)=P(A1)+P(A2)+P(An).4.对n个事件A1,A2,An,若 Ai Aj=(i j,i,j=1,2,n)且 A1+A2+An=,则 P(A1)+P(A2)+P(An)=1。5.P()=1 P(A).例例5 某公司从甲、乙两地购进建材,甲地能按时供应的概率是0.84,乙地能按时供应的概率是0.79。这两地都能按时供应的概率为0.65。求至少有一地能按时供应的概率。解:设 A=“甲地能按时供应”,B=“乙地能按时供应”,C=“至少有一地能按时供应”,显然A、B两个事件相容,且 C=A+B。P(C)=P
9、(A+B)=P(A)+P(B)P(AB)=0.84+0.790.65 =0.98.4 条件概率与乘法公式条件概率与乘法公式 一、条件概率:一、条件概率:事件B发生的条件下事件A发生的概率,定义为()(|)()0).()(|)0,()0).(1)(|):(|);():()BABBAP ABP A BP BP BP A BP BP A BAKP A BNP AAKP AN当时当时:条件概率实际上是在缩小的样本空间上求发生的概率而无条件概率是在原样本空间内求发生的概率注例例6 在某公司中,有500人符合晋升到100个新职位的条件,他们中有95人获得了晋升,另外晋升的5人是从外面引进的。求新职位上的人
10、来自公司内部的概率。解法1:令B=新职位上的人来自公司内部,C=一个人已得到晋升(在新职位上),D=一个人来自公司内部。则C和D看作同一样本空间上的两个事件,解法2:把“从新职位上选取1人”看作随机试验,则有100种可能的结果,即样本空间中样本总数为100,而其中属于事件B的有95个。故|()95|()(|)95%|()100|DCDCP DCP BP D CCP CC95()95%.100P B 二、概率的乘法公式二、概率的乘法公式 P(AB)=P(A)P(B|A)=P(B)P(A|B),P(A1 A2An)=P(A1)P(A2|A1)P(A3|A1 A2)P(An|A1 A2An-1).例
11、例7 7 某厂生产100个零件中有5个次品,采用不放回抽样,每次从中任取一个,分别求第一次抽到次品、第一次和第二次都抽到次品、第一、二、三次都抽到次品的概率。解:设A、B、C分别表示第一、二、三次抽到次品,则2521003531005()0.05100541()()(|)100994955431()()(|)(|().100999816170541()100994955431().100999816170P AP ABP A P B AP ABCP A P B A P CABCP ABCCP ABCC或例例8 已知一批产品有4%的废品,而合格品中一等品占55%。现从这批产品中任取一件,求这件产
12、品是一等品的概率。解解:设 A=取出一等品;B=取出合格品;.()4%0.04,(|)55%0.55.,.()()()(|)(1()(|)(10.04)0.550.528.BP BP A BABAABP AP ABP B P A BP BP A B则取出废品由条件,又因故从而 5 事件的独立性事件的独立性 若一个事件发生的概率不受另一事件发生的影响,则称这两个事件是相互独立的。或者说,若 P(B|A)=P(B),则称 A 与 B 相互独立。注注:事件A与 B 相互独立当且仅当 P(AB)=P(A)P(B).例例9 某厂生产的100个零件中有5个次品,采用有放回抽样,求抽出的第1件为正品且第2件
13、是次品的概率,及第二次抽到次品的概率。解:设 A为第一次抽到的是正品;B为第二次抽到的是次品。则 P(A)=95/100,P(B|A)=5/100,P(B)=5/100。注:由计算结果可见,本例中事件A与B是相互独立的。下面我们来检验一下是否 P(AB)=P(A)P(B)。事实上,由于A与B相互独立,事件AB可看成一个事件分两个阶段发生:“第一次抽到正品,第二次抽到次品”,第一阶段事件发生的可能性为 ,第二阶段事件发生的可能性为 故按乘法原理,1951100CC151100.CC1195511100100955()()()100 100CCP ABP A P BCC例例9 某厂生产的100个零
14、件中有5个次品,采用有放回抽样,求抽出的第1件为正品且第2件是次品的概率,及第二次抽到次品的概率。解:设 A为第一次抽到的是正品;B为第二次抽到的是次品。则 P(A)=95/100,P(B|A)=5/100,P(B)=5/100。注:由计算结果可见,本例中事件A与B是相互独立的。下面我们来检验一下是否 P(AB)=P(A)P(B)。事实上,由于A与B相互独立,事件AB可看成一个事件分两个阶段发生:“第一次抽到正品,第二次抽到次品”,第一阶段事件发生的可能性为 ,第二阶段事件发生的可能性为 故按乘法原理,1951100CC151100.CC1195511100100955()()()100 10
15、0CCP ABP A P BCC6 随机变量的概念随机变量的概念 设试验 E 的样本空间为,X(e)是与样本 e 有关的一个量。若对每个可能发生的结果(样本)e,都有唯一的实数X(e)与之对应,则称变量X(e)为随机变量,简记为 X。注注:(1)若一个随机变量 X 的所有取值能够一一列举出来,则称 X为离散型随机变量。离散型随机变量可以取有限个值,也可以取无限个值(可数个)。(2)若X 的所有取值不能一一列举,而是在一连续区间内取值,则称X 为连续型随机变量。例例10(1)投掷一枚硬币,其样本只有“出现正面”和“出现反面”两个。若用 X=0表示“出现正面”,用 X=1表示“出现反面”,则X就是
16、一个(离散型)随机变量。类似地,假定一天的天气情况只分为阴、晴、雨三种,分别用X=0、1、2表示明天的天气为阴、晴、雨,则X也是一个(离散型)随机变量。(2)某商店每天最多销售5台洗衣机,令X 表示该商店某日销售洗衣机的台数,则X 是一个(离散型)随机变量,它的取值范围是0,1,2,3,4,5。(X=0),(X=1),(X=5)这6个基本事件(样本)描述了日销售洗衣机台数的所有可能结果,它们构成了样本空间。每一基本事件的出现,都可用X 的某个取值来表示。(3)考虑“测验灯泡寿命”的实验。令X 表示灯泡寿命(以小时计),则X为一个连续型随机变量。而(X500),(X1000),(800X0 且
17、,则称数列pi 为X 的概率分布列,简称为X 的概率分布。注注:(1)有时也将函数P(X=xi)=pi(i=1,2,)称为X 的概率分布;(2)为简化起见,常把P(X=xi)简写为P(xi),把P(X=j)简写为P(j)。(3)离散型随机变量的概率分布P(xi)=pi(i=1,2,)必须具备的两 个基本条件:(i)pi 0(i=1,2,),;(ii)。(4)离散型随机变量的概率分布可以用数列、表格或图象来表示。1iip 1iip 例例11.某商店100天来洗衣机的销售情况如下:令X表示“日销售量”这一随机变量,用频率代替概率,则X的概率分布为:用图象表示,则为:日销售量(台)012345天数(
18、天)82520181514xi012345pi0.080.250.200.180.150.14pX0.10.30.2432105二、离散型随机变量的分布函数二、离散型随机变量的分布函数离散型随机变量X 的分布函数为F(x)=。离散型随机变量的分布列和分布函数可以互相确定,它们都描述了随机变量取值的统计规律性。kkxxp例例12 在例14中,已销售洗衣机的数量这一随机变量X的分布列为:其分布函数为:xi012345pi0.080.250.200.180.150.14000.08010.3312()0.53230.71340.864515xxxF xxxxx三、连续型随机变量的概率密度函数三、连续
19、型随机变量的概率密度函数 连续型随机变量X的取值范围是一个连续的区间,这些取值不能一一列出。可以证明,对任意取定的 x,P(X=x)=0.也就是说,连续型随机变量取某个具体值X=x的事件虽然不是不可能事件,但它发生的概率为0。在实际应用中,人们一般也不会对连续型随机变量取某一个确定值的概率问题感兴趣。例如某一灯泡的寿命是否等于1000.135小时等。人们通常关心的是随机变量的取值落在某一范围内的概率问题。为此,需要定义连续型随机变量的概率密度函数。0,0.()(,)()()lim,()()0;()1;:xXa bxa bxP xXxxxXx xxP xXxxf xxXxxa bf xxXf x
20、f x dx 设是在上取值的连续型随机变量,称比值为随机变量在上的而称极限值为随机变量在处的当 在上变化时,构成 的函数,称为的 (1平均概率密度,概率密度。概率)密度函数。概率密度函(2)数的性质2112()().xxP xXxf x dx (3)四、连续型随机变量的分布函数四、连续型随机变量的分布函数 设X为一连续型随机变量,函数称为随机变量X的分布函数.随机变量X的分布函数F(x)与概率密度函数 f(x)的关系:F(x)=f(x)即 F(x)是 f(x)的原函数。从而 ()()()xF xP Xxf t dt211221()()()().xxP xXxf x dxF xF x四、连续型随
21、机变量的分布函数四、连续型随机变量的分布函数 设X为一连续型随机变量,函数称为随机变量X的分布函数.随机变量X的分布函数F(x)与概率密度函数 f(x)的关系:F(x)=f(x)即 F(x)是 f(x)的原函数。从而 ()()()xF xP Xxf t dt211221()()()().xxP xXxf x dxF xF x没晕吧没晕吧#&*?+!9 随机变量的数学期望和方差随机变量的数学期望和方差一、离散型随机变量数学期望的概念一、离散型随机变量数学期望的概念 设X是离散型随机变量,其概率分布列为P(xi)=pi,i=1,2,则定义X 的数学期望为:注注:X的数学期望实际上是对X的各个取值
22、xi 以其概率 pi 作为权的一种加权平均。它给出了随机变量概率分布重心的位置,即在概率意义下随机变量各个取值的平均值。因此数学期望有时也称为均值。()iiiE Xx p例例13 设有甲、乙两个射手,他们的射击技术如下表:甲:乙:问哪个射手射击技术较好?解:用 X 表示“甲击中环数”,Y 表示“乙击中环数”。则:E(X)=8 0.3+9 0.1+10 0.6=9.3 E(Y)=8 0.2+9 0.5+10 0.3=9.1.在平均意义下,甲的射击技术较好。击中环数8910概率0.30.10.6击中环数8910概率0.20.50.3例例14 下表为某社区2003年每个家庭去社区诊所就医次数X的概率
23、分布:求社区家庭去该诊所就医次数的数学期望。解:E(X)=0 0.17+1 0.20+2 0.35+3 0.25+4 0.03 =1.77.这表明该社区每个家庭去社区诊所就医的次数在平均意义下为1.77次。年就医次数xi01234pi0.170.200.350.250.03二、数学期望的性质二、数学期望的性质(1)设 c 为常数,则 E(c)=c;(2)设 c 为常数,则 E(cX)=c E(X);(3)E(X+Y)=E(X)+E(Y);E(X1+X2+Xn)=E(X1)+E(X2)+E(Xn);(4)设 X、Y 是相互独立的随机变量,则E(XY)=E(X)E(Y)。对 n 个相互独立的随机变
24、量 X1,X2,XnE(X1X2Xn)=E(X1)E(X2)E(Xn);(5)设 Y=a+bX,(a,b为常数),则E(Y)=a+bE(X).三、三、离散型随机变量离散型随机变量方差的概念方差的概念 方差是一个用来描述随机变量取值分布的离散或集中程度的量。它反映随机变量所有可能的取值相对于平均值(数学期望)的偏差。具体来说,设X是一个离散型随机变量(其分布列为P(xi)=pi,i=1,2,),X的方差D(X)定义为2222()()()()().()().().iiiD XEXE XxE XpXD XXD XXX而称为随机变量的标准差或均方差:因 故有时也用表示方差注例例15 A、B两班的数学考
25、试成绩X与Y的分布如下:A 班:B 班:两班的成绩均值E(X)=E(Y)=69。但实际上两班的成绩差别很大,A班成绩较集中,B班成绩较分散,体现在方差上,则 D(X)=0.2(6069)2+0.7(7069)2+0.1(8069)2 =29;D(Y)=0.3(5069)2+0.15(6069)2+0.1(7069)2 +0.25(8069)2+0.2(9069)2 =108.3+12.15+0.1+30.25+88.2=239.X和Y 的标准差分别为:xi607080pi0.20.70.1yi5060708090pi0.30.150.10.250.2()()295.3852;()()23915
26、.4596.XD XYD Y四、方差的性质:四、方差的性质:(1)D(X)=E(X2)(E(X)2;(2)设 c 是常数,则D(c)=0;(3)设 c 是常数,则D(cX)=c2D(X);(4)设X、Y是两个随机变量,则 D(X Y)=D(X)+D(Y)2E(XE(X)YE(Y).特别地,若X、Y相互独立,则 D(X Y)=D(X)+D(Y)。五、连续型随机变量的数学期望和方差五、连续型随机变量的数学期望和方差 设X为连续型随机变量,其概率密度函数为f(x),则 X 的数学期望和方差分别定义为连续型随机变量的数学期望和方差也具有与离散型随机变量的数学期望和方差相同的性质。注注:有些文献上用Va
27、r(X)表示X 的方差。22()();()()()().E Xxf x dxD XEXE XxE Xf x dx10 统计学中常用的随机变量及其分布统计学中常用的随机变量及其分布一、01分布分布 设随机变量X表示一次贝努里试验中“成功”出现的次数,则X只有0,1两个取值。设“成功”出现的概率为 p,则 X 的分布列为 P(X=0)p0=1 p,P(X=1)p1=p;即:pk=p k(1 p)1 k,k=0,1,(0p1)这种分布列称为01分布分布(也称为贝努里分布或两点分布),若一个随机变量服从01分布,则记为X(0,1)。设X(0,1),则X的数学期望和方差如下:E(X)=p,D(X)=p(
28、1 p).二、均匀分布均匀分布 设随机变量 X 的一切可能取值充满区间 a,b,且X 落在 a,b内的任一子区间 x0,x0+x上的概率与区间的长度 x 成正比,即 P(x0 x x0+x)=k x,(k 是一个确定的比例常数),则称 X 服从均匀分布(uniform distribution)。记为XU(a,b).注注:若随机变量 X 服从均匀分布,则X 落在(a,b)内的任何等长度子区间内的可能性(概率)相等。设 XU(a,b),则X 的概率密度函数和分布函数分别为:201(),().01()(),().212xaaxbxaf xF xaxbbabaxbXabbaE XD X其它的数学期望
29、和方差分别为:三、指数分布三、指数分布 若连续型变量X的概率密度函数为则称X服从指数分布,记为X e().指数分布的分布函数为:指数分布的数学期望和方差为:E(X)=1/,D(X)=1/2.指数分布常用来作为各种”寿命”的近似分布。例如动物的寿命、电子元器件的使用时间、随机服务系统中的服务时间等,都近似服从指数分布。0()(0)00 xexf xx10()(0)00 xexF xx 四、正态分布四、正态分布 若连续型随机变量X 的概率密度函数为2222()222()221(),2,0,(),(,)1(),.2,0,1,(0,1)()xtxf xexXnormal distributionXNF
30、 xedtxNx 其中均为常数且则称服从参数为的记为。正态分布标准正态分布随机变量的分布函数为 特别地 当时称为。它的概率密度函数和分布函数分别为正态分布22221,;21(),.2xtxexxedtx 设 XN(2),则随机变量X的数学期望和方差为:E(X)=,D(X)=2.特别地,若X 服从标准正态分布,则E(X)=0,D(X)=1。正态分布的随机变量密度函数的图象(见大纲P20-21或教程P198-199)。关于标准正态分布的几个公式:(1)()();(2)()1();(3)()(),()()xxxxxxF xF xxX -其中和分别是正态分布和标准 正态分布的分布函数。此式说明,若随机
31、变量服从正态 分布,则随机变量服从标准正态分布。标准正态分布的 分位点分位点 对给定的正数,0 1,称满足条件所谓正态分布即正常状态下的分布。它表现为其取值具有对称性,绝大部分取值集中在以对称点为中心的一个小区间内,只有少量取值落在区间外。如人的身体特征(身高、体重)、学习成绩、工业产品的数量指标等都服从正态分布。许多较复杂的指标,只要在受到大量因素作用下每个因素的影响都不显著,且因素相互独立,则一般都近似服从正态分布。Z(Z)()Z,Z,ZP Xx dx的点为标准正态分布的 上分位点当确定后是一个确定的值给定 后 上 分位点可查正态分布表求得 五、五、2分布分布 (1)定义定义:设 X1,X
32、2,Xn是来自标准正态总体N(0,1)的样本,则随机变量 2 X12+X22+Xn2 服从自由度为n的 2分布,记为 2 2(n)。其中自由度是指上式 右端包含的独立变量的个数。(2)2(n)分布的概率密度函数为分布的概率密度函数为:2212221,02()()0,0nnxnxexfxx210122642()()=,(0).:()(1)();()(1)!;()(1)(2)1;()().()(,)pxppxe dxpipppiinniiiivfxPP 其中称为函数,定义为它具有性质的图形见教材 大纲教程(3)2分布的性质分布的性质 (i)可加性:设 12 2(n1),12 2(n2),并且 12
33、与22相互独立,则(12+22)2(n1+n2)。(ii)若 2 2(n),则E(2)=n,D(2)=2n。(4)分位点分位点 对给定的正数,0 1,称满足条件22222()2224222()()()(),(),()()(,),()()nnnPnfx dxnnnnnfxPPnnn26的点为分布的 当 和确定后是一个确定的值它是的概率密度函数的自变量的某个取值 见教材 大纲教程给定 和 后分布上分位的上 分位点可查分布表求得点六、六、t分布分布 12224327()212:(0,1),(),()-()()()(1),()(,):,01,()()(1)(2)(3)nYntttnnnXXNYnXYt
34、nttt ntt nxf xxnnPPP ttnf x dx 定义设且 与 相互独立 则随机变量服从自由度为 的分布,记为分布的概率密度函数为其图形见教材 教程大纲上 分位点对给定的正数称满足条件45271()(),()(,):()().,()()ntnt nntnPPtntnnt ntt 的点为分布的当 和 确定后是一个确定的值见教材图形 教程大纲可以证明上给定 和 后分布分位点的上 分位点可查分布表求得七、七、F分布分布11121212221211222221212121214528222(),(),(,),(,)(,)()()(1),0()()()0,0(,)(1)(2)UnVnFnn nnnnnnnnnnUnVnU VFn nFFF n nFF n nxxxfxxPP设,且相互独立则称随机变量服从自由度为的分布记为分布的概率密度函数为其图形见教材 教程大纲12122112(,)1212112211212121(,),(,):,01,(,)()(,)(,)1:(,)(,),(,)(,)(3)(4)FFn nFFF n nF n nP FF n nfx dxF n nF n nFn nF n nn nF n nF n nF由定义知,若则上 分位点对给定的正数称满足条件的点为分布的可以证明给定和 后分布的上 分位点可查分上位点布表求得分