1、2022-11-261第二章第二章 概率分布概率分布2022-11-262引引 言言l由于存在个体差异,即使从同一总体中抽取的由于存在个体差异,即使从同一总体中抽取的两份样本之间也会有所不同,因此需要对总体两份样本之间也会有所不同,因此需要对总体特征做出描述。特征做出描述。l随机变量的分布常见的有三种类型:随机变量的分布常见的有三种类型:正态分布(正态分布(normal distribution)二项分布(二项分布(binominal distribution)Poisson 分布(分布(Poisson distribution)离散型变量离散型变量连续型变量连续型变量2022-11-263了
2、解了解l正态分布的密度函数正态分布的密度函数l二项分布的应用二项分布的应用l Poisson分布的应用分布的应用掌握掌握p正态分布曲线的特征正态分布曲线的特征及应用及应用p二项分布的概念与特二项分布的概念与特征征pPoisson分布的概念与分布的概念与特征特征【教学目的教学目的】2022-11-2641.概念概念频率密度图的绘制频率密度图的绘制例:随机调查某医院例:随机调查某医院1402例待分娩孕妇,测得她们的体重。例待分娩孕妇,测得她们的体重。体重在各组段的频数分布见表体重在各组段的频数分布见表1第第2列,并求得体重落在列,并求得体重落在各组段的频率(表各组段的频率(表1的第的第3列)。列)
3、。现以体重测量值为横现以体重测量值为横轴,以频率与组距的比值为纵轴作出直方图。由于轴,以频率与组距的比值为纵轴作出直方图。由于该直方图的纵轴表示在每个组段内单位长所占有的该直方图的纵轴表示在每个组段内单位长所占有的频率,相当于频率密度,因此我们将此图称为频率频率,相当于频率密度,因此我们将此图称为频率密度图(见图密度图(见图1)。)。一、正态分布2022-11-265表表1 某医院某医院1402例分娩孕妇体重频数分布例分娩孕妇体重频数分布体重组段体重组段 频数频数频率频率(频数频数/总频数总频数)累积频率累积频率频率密度频率密度(频率频率/组距组距)48-60.00430.00430.0011
4、 52-540.03850.04280.009656-1620.11550.15830.028960-2930.20900.36730.052264-3590.25610.62340.064068-2980.21260.83590.053172-1400.09990.9358 0.025076-700.04990.9857 0.012580-170.01210.9979 0.003084-30.00211.0000 0.0005合计合计14021.00000.000.020.040.060.0848-56-64-72-80-体重(kg)体重频率密度 图图1 体重频率密度图体重频率密度图 202
5、2-11-267 若将各直条顶端的中点顺次连接起来若将各直条顶端的中点顺次连接起来,得得到一条折线。当样本量到一条折线。当样本量n越来越大时,组段越越来越大时,组段越分越细,此时直方渐进直条,这条折线就越来分越细,此时直方渐进直条,这条折线就越来越接近于一条光滑的曲线(见图越接近于一条光滑的曲线(见图1、2),我们),我们把这条呈中间高,两边低,左右基本对称的把这条呈中间高,两边低,左右基本对称的“钟型钟型”曲线称为正态分布曲线,曲线称为正态分布曲线,近似于数学近似于数学上的正态分布(高斯分布上的正态分布(高斯分布;Gauss)。)。2022-11-2680.000.020.040.060.0
6、848-56-64-72-80-体重(kg)体重频率密度 图图1 体重频率密度图体重频率密度图 图图2 概率密度曲线示意图概率密度曲线示意图 2022-11-269正态分布的密度函数正态分布的密度函数 XeXfX,21)(222/)(式中,式中,为总体均数,为总体均数,为总体标准差,为总体标准差,为圆周为圆周率,率,e为自然对数的底,仅为自然对数的底,仅x为变量。为变量。当当x确定后,确定后,f(x)为为X相应的纵坐标高度,则相应的纵坐标高度,则X服服从参数为从参数为和和2的正态分布的正态分布(normal distribution),记,记作作XN(,2)。2022-11-2610 一般地,
7、若连续型随机变量,设其概率密度函一般地,若连续型随机变量,设其概率密度函数为数为 ,则,则X取值落在区间取值落在区间 内的累积内的累积概率为概率密度曲线下位于概率为概率密度曲线下位于 的图形面积,的图形面积,等于其概率密度函数等于其概率密度函数 在在 到到x上的积分,记上的积分,记作作 。)(xF)(xf),(x ),(x )(xf 称称 为正态分布为正态分布 的概率密度函的概率密度函数。其值表示变量落在区间数。其值表示变量落在区间 的概率,的概率,对应于从对应于从-到到x概率密度曲线下的阴影的面概率密度曲线下的阴影的面积(常称为左侧尾部面积),见图积(常称为左侧尾部面积),见图3。xttxX
8、PxFde21)()(222)()(xF),(2 N),(x 2022-11-2612图图3 正态分布的概率密度函数正态分布的概率密度函数 2022-11-2613 于是,利用概率密度函数于是,利用概率密度函数 可以计算正态可以计算正态分布变量取值在任意区间(分布变量取值在任意区间(a,b)的概率为)的概率为)(xFP(aX5,且,且n(1-)5时,二项分布趋于正态分布。时,二项分布趋于正态分布。2(1)n图7 二项分布的概率分布示意图 2022-11-26534.二项分布的应用二项分布的应用4.1 应用条件应用条件(1)各观察单位只具有相互对立的两种结果;各观察单位只具有相互对立的两种结果;
9、(2)已知发生某一结果的概率为已知发生某一结果的概率为,其对立结果的概,其对立结果的概率则为率则为1-;(3)n个观察单位的观察结果相互独立。个观察单位的观察结果相互独立。4.2 应用应用概率计算;概率计算;2022-11-2654例:据报道,有例:据报道,有10%的人对某药有肠道反应。为考的人对某药有肠道反应。为考察此药的质量,现随机选察此药的质量,现随机选5人服用此药,试求人服用此药,试求:(1)其中其中k个人个人(k=0,1,2,3,4,5)有反应的概率;有反应的概率;(2)不不多于多于2人有反应的概率;人有反应的概率;(3)有人有反应的概率。有人有反应的概率。)!xn(!x!nC,)1
10、()(xn 其其中中,XnXXnCXP X=k012345P(X=K)0.59049 0.32805 0.07290 0.00810 0.00045 0.00001例:设在人群中感染某种疾病的概率为例:设在人群中感染某种疾病的概率为20%,现有,现有两种疫苗,用疫苗两种疫苗,用疫苗A注射了注射了15人后无一感染,用人后无一感染,用疫苗疫苗B注射注射15人后有人后有1人感染,设人群没有相互传人感染,设人群没有相互传染疾病的可能,问:应该如何评价这两种疫苗?染疾病的可能,问:应该如何评价这两种疫苗?解:假设疫苗解:假设疫苗A、B完全无效,那么注射后感染的概完全无效,那么注射后感染的概率仍为率仍为2
11、0%,则,则15人中染病人数人中染病人数XB(15,0.20)。X=0的概率为的概率为0352.080.020.0)0(150015 CXP1671.08.02.080.020.0)1(141115150015 CCXPX1的概率为的概率为2022-11-2656 Poisson分布是一个重要的离散型概率分布。一般分布是一个重要的离散型概率分布。一般地,地,Poisson分布应用于观察例数分布应用于观察例数n很大、而很大、而 发生发生的概率很小的情况。如,交通事故发生数,某些的概率很小的情况。如,交通事故发生数,某些罕见疾病发生数,单位容积中的细菌计数、细胞罕见疾病发生数,单位容积中的细菌计数
12、、细胞计数,放射性物质在单位时间内放射的粒子数,计数,放射性物质在单位时间内放射的粒子数,单位空间的粉尘个数等等。此时,随机变量单位空间的粉尘个数等等。此时,随机变量X(发(发生数等)所有可能的取值以及相应的概率分布即生数等)所有可能的取值以及相应的概率分布即为为Poisson分布。分布。三、三、Poisson分布分布历史上,历史上,Poisson分布是作为二项分布的分布是作为二项分布的近似,于近似,于1837年由法国数学家年由法国数学家Poisson引入引入。近年来,近年来,PoissonPoisson分布日益显示其重要分布日益显示其重要性性,成为概率论中最重要的几个分布之一。成为概率论中最
13、重要的几个分布之一。在实际生活中,许多随机现象服从或近在实际生活中,许多随机现象服从或近似服从泊松分布。似服从泊松分布。在生物学、医学、工业统计、保险科学等问在生物学、医学、工业统计、保险科学等问题中题中,泊松分布是常见的。如地震、火山爆发、特泊松分布是常见的。如地震、火山爆发、特大洪水、交通事故次数等大洪水、交通事故次数等,都服从泊松分布。都服从泊松分布。地地震震火火山山爆爆发发特特大大洪洪水水交交通通事事故故次次数数泊松分布的图形泊松分布的图形图图8 Poisson分布的示意图分布的示意图2022-11-26601.Poisson分布的概率函数:分布的概率函数:此处此处 0,是某一常数,是
14、某一常数,e是自然对数的底数,称是自然对数的底数,称X服从参数为服从参数为 的的Poisson分布,记为分布,记为XP(),210,!)(kekkXPk knkknnnCkXP )1()(ekkXPk!)(可见,可见,Poisson分布可作为二项分布的极限而得到。分布可作为二项分布的极限而得到。换言之,如果换言之,如果XB(n,),当,当 很小,而很小,而n很大时,可很大时,可以认为以认为X近似服从近似服从=n 的的Poisson分布分布P()。2022-11-2661(1)Poisson分布属于离散型分布,分布属于离散型分布,是是Poisson分布的总体参分布的总体参数,也是唯一的参数。数,
15、也是唯一的参数。(2)方差方差 2与均数与均数 相等,即相等,即=2。这是这是Poisson分布的一个非分布的一个非常重要而且非常独特的性质,经常用于判断某随机事件常重要而且非常独特的性质,经常用于判断某随机事件是否服从是否服从Poisson分布。分布。(3)设设 且且 ,并且,并且X1与与X2相互独立,则相互独立,则 服从总体均数为服从总体均数为 的的Poisson分布。分布。(4)当当20时,时,poisson分布近似正态分布分布近似正态分布 2.Poisson分布的特性分布的特性11()XP22()XP12YXX122022-11-26623.应用应用应用条件:应用条件:由于由于Pois
16、son分布可以看作二项分布的极限分布,分布可以看作二项分布的极限分布,二项分布的应用条件也是二项分布的应用条件也是Poisson分布的应用条件。分布的应用条件。此外,此外,Poisson分布还要求试验次数分布还要求试验次数n很大,而所很大,而所关心的事件发生的概率关心的事件发生的概率 很小。很小。2022-11-2663概率计算概率计算例例:为监测饮用水的污染情况,现检验某社区每毫为监测饮用水的污染情况,现检验某社区每毫升饮用水中细菌数,共得升饮用水中细菌数,共得400个,记录如下表:个,记录如下表:表表5 5 某社区每毫升饮用水中细菌数某社区每毫升饮用水中细菌数1ml水中细菌数水中细菌数01
17、23合计合计次数次数f243120316400试分析饮用水中细菌数的分布是否服从试分析饮用水中细菌数的分布是否服从Poisson分布。若服从,计算每毫升水中细菌数的概率分布。若服从,计算每毫升水中细菌数的概率及理论次数,并将次数分布与及理论次数,并将次数分布与Poisson分布做直分布做直观比较观比较2022-11-2664得:经计算得每毫升水中平均细菌数得:经计算得每毫升水中平均细菌数 =0.5,方,方差差S2=0.496。两者接近,近似服从。两者接近,近似服从Poisson分布。分布。X2,1,0,!5.0)(5.0 kekkXPk细菌数细菌数 实际次数实际次数频率频率概率概率理论次数理论
18、次数0243 0.6075 0.6065242.601120 0.3000 0.3033121.32231 0.0775 0.075830.3236 0.0150 0.01445.76合计合计400 1.0000 1.0000400.002022-11-2665 例如某均匀的溶液中,每例如某均匀的溶液中,每ml含有含有3个细菌,即个细菌,即XP(3)。现考虑)。现考虑5ml溶液中的细菌的分布情况。溶液中的细菌的分布情况。由于由于X iP(3)i=1,2,3,4,5。据。据Poisson分布的分布的可加性可得:可加性可得:X1 X2 X3 X4 X5 P(15)即即5ml溶液中的细菌数仍然服从溶
19、液中的细菌数仍然服从Poisson分布,均分布,均数为数为15。2022-11-2666 选择题选择题 1.理论上,二项分布是一种理论上,二项分布是一种A 连续性分布连续性分布 B 离散分布离散分布 C 均匀分布均匀分布 D 标准正态分布标准正态分布 2.在样本例数不变的情况下,下列何种情况时,二在样本例数不变的情况下,下列何种情况时,二项分布越接近对称分布。项分布越接近对称分布。A 总体比例总体比例越大越大 B 样本比例样本比例P越大越大 C 总体比例总体比例越接近越接近0.5 D 总体比例总体比例越小越小 2022-11-26673.某种人群(如成年男子)的某个生理指标(如收缩压)或某种人
20、群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般生化指标(如血糖水平)的正常值范围一般 A.该指标在所有人中的波动范围该指标在所有人中的波动范围 B.该指标在所有正常人中的波动范围该指标在所有正常人中的波动范围 C.该指标在绝大部分正常人中的波动范围该指标在绝大部分正常人中的波动范围 D.该指标在少部分正常人中的波动范围该指标在少部分正常人中的波动范围 E.该指标在一个人不同时间的波动范围该指标在一个人不同时间的波动范围 2022-11-26684.4.正态分布的特点有正态分布的特点有A.A.算术均数算术均数=几何均数几何均数 B.B.算术均数算术均数=中位数
21、中位数C.C.几何均数几何均数=中位数中位数 D.D.算术均数算术均数=几何均数几何均数=中位数中位数E.E.以上都没有以上都没有2022-11-26695.5.正态分布曲线下右侧正态分布曲线下右侧5 5对应的分位点为对应的分位点为A.+1.96 A.+1.96 B.-1.96B.-1.96C.+2.58 C.+2.58 D.+1.64D.+1.64E.-2.58E.-2.582022-11-2670 计算题计算题 某地某地1998年抽样调查了年抽样调查了100名名18岁男大学生身高,岁男大学生身高,其均数其均数=172.70cm,标准差,标准差=4.01 cm。(1)估计该地)估计该地18岁男大学生身高在岁男大学生身高在168 cm以下者占以下者占该地该地18岁男大学生总数的百分数;岁男大学生总数的百分数;(2)估计该地)估计该地18岁男大学生身高在岁男大学生身高在177 cm以下者占以下者占该地该地18岁男大学生总数的百分数。岁男大学生总数的百分数。2022-11-2671