1、1第五章第五章 离散型变量的概率分布离散型变量的概率分布n学习目标学习目标n 1.确定可以用二项分布描述的统计试验并会计算和应用。n 2.确定可以用泊松分布描述的统计试验并会计算和应用。n 2习 题n1.P144-3(P170-3)4.P151-17 (P178-17)n2.P147-8(P173-8)5.P160-30 (P192-28)n3.P149-14(P175-14)6.P164-40 (P197-36)3n 概率分布概率分布(probability distribution):随机变量取一切可能值或范围的概率或概率的规律,简称分布分布。4第一节第一节 离散型概率分布的基本问题离散型
2、概率分布的基本问题n一、概率函数 n 离散变量只取离散的值,比如骰子的点数、次品的个数、得病的人数等等。n 变量的每一种取值都有某种概率。离散变量取特定值的概率称为概率函数概率函数(Probability function)5n二、离散概率函数需满足以下两个条件:二、离散概率函数需满足以下两个条件:0 xf 1xf 期望值期望值(Expected value)随机变量的均值或中心位置的测度。xxfxE6n 方差方差(Variance)对随机变量的差异性或离散性的一种测度。xfxxVar227【案 例】n 北方汽车公司在过去300天时间内汽车的销售资料如下:8n根据上述资料:n 1.给出北方汽车
3、公司在过去300天时间内,某一天销售汽车数目的概率分布。n 2.绘制北方汽车公司在过去300天时间内,某一天销售汽车数目的概率分布图。n 3.计算北方汽车公司每天汽车销售量的期望值和方差。n 4.假如你是该公司经理,对上述数据资料会做出哪些反应?91011 辆5.101.0539.0118.00 xxfxE12 25.122xfx13第二节第二节 二项概率分布二项概率分布n一、二项分布的假设条件一、二项分布的假设条件n 1.试验是由一个包含n次相同的序列组成。n 2.每次试验都有两种可能的结果。我们把其中一个称为成功成功,另一个称为失失败败。n 3.成功的概率用p表示,失败的概率用q表示(q=
4、1 p)。p和q不随着试验的变化而变化。n 4.试验都是独立的。14n*成功和失败的确定n 通常,把研究者感兴趣的结果定义为成功(是)。n 把成功的反面定义为失败(非)。n 例如,在质量管理中要测定次品的数量,就会把找到一个次品定义为成功,即使次品对这个工厂不是好事。15n*关于各个试验相互独立的确定n (1)试验本身是独立的,如扔硬币或掷骰子。n (2)试验是有放回试验。n 各个试验相互独立的假设,目的就是保证成功的概率p在各次试验中不变。n 以下情况可以不考虑相互独立的假设:%5Nn16n二、二项分布的概率函数二、二项分布的概率函数 xnxxnxnxppxnxnppxf11!xf:n次试验
5、中x次成功的概率n:试验次数!xnxnnxn次试验中恰有x次成功的试验结果个数17【案 例】n 北京某大商场计划在郊区建一家分店。商场准备当分店建成后从处于市中心的总店调一批员工到分店工作。n 商场人事部门在确定调动人员名单时遭到部分员工的拒绝。经过调查发现,员工不愿意更换工作地点的原因主要有家庭原因、经济原因等等。其中,有4%的被调查者指出:他们拒绝的原因是,更换工作地点到郊区工作得到的补助太少。18n 现随机抽取5名拒绝更换工作地点的员工进行调查。研究其中有1名员工因为得到补助太少而拒绝,其余4人是因为其他原因而拒绝的概率是多少?19n已知:nn=5 p=0.04 (1-p)=0.96 x
6、=1 n利用二项分布概率函数公式计算:16985.096.004.015151141!xnxxnxnxppxnxnppxf20n统计分析:n 该商场在对拒绝更换工作地点的员工随机抽取5名人员中,恰有1人因为得到补助太少而拒绝,其余4人因为其他原因而拒绝的概率是0.16985。n问题进一步展开:n 根据这样一种研究结果,该商场人事部门该做出什么样的决策呢?21n三、二项概率表的使用三、二项概率表的使用n见教科书P459表5(机械版)。n四、二项概率分布的期望值和方差四、二项概率分布的期望值和方差 npxE pnpxVar1222n 例如,利用上述公式计算案例中的期望值、方差和标准差 人2.004
7、.05npxE 1920.096.004.051pnpxVar 人44.01920.0 xVars23n问题:n 在本案例中,上述期望值0.2人的含义是什么?n 0.2的含义是,在该商场拒绝更换工作地点的员工中,平均每5人就有0.2人是因为得到的补助太少而拒绝到郊区工作。24n 假如该商场计划从总店抽调100名员工到分店上班。其中,有40人拒绝人事部门的安排。估计一下,这些拒绝的人中大约有多少是因为得到的补助太少而做出这一决定的呢?n 在抽调100名员工到分店上班而遭到拒绝的40名员工中,会有1.6名员工是因为补助太少而做出不去分店上班的决定。25n算法1:人6.104.0401pnn算法2:
8、人人人人6.15/2.0401xEnn26【补充内容】n 商务统计中的是非标志(交替标志)及其期望值和方差n凡是某种现象能够被分成两部分,其中,我们感兴趣的那部分(要研究的那部分)称为是(相当于前面的成功),不感兴趣的那部分(不研究的那部分)称为非(相当于前面的失败)。27是非标志的有关符号n1:具有“是”标志的标志值(变量值)n0:具有“非”标志的标志值(变量值)nN:总体单位个数nN1:具有是标志的单位个数nN0:具有非标志的单位个数np:具有是标志的单位个数占总体单位数的比重,即p=N1/Nnq:具有非标志的单位个数占总体单位数的比重,即q=N0/N28是非标志的期望值和方差 pxE p
9、px1var 例:某企业生产的500件产品中,经检验有5件废品。问:该企业产品的平均合格率是多少?29利用Excel计算二项分布的概率n1.选择fx(粘贴函数)n2.在“选择类别”中“统计”n3.在“选择函数”中“BINOMDIST”n4.在第一个框输入X值,第二个框输入n值,第三个框输入p值,第四个框键入单一概率(X5)“false”或累积概率(X小于等于5)“true”n5.确定30课后实践n教科书第171页附录5B,用Excel计算马丁服装商店二项分布概率。31第三节第三节 泊松概率分布泊松概率分布 n 泊松分布泊松分布(Poisson distribution)考虑在某一时间或空间段出
10、现的次数。n一、泊松分布的特点(运用条件)一、泊松分布的特点(运用条件)n1.它是离散型分布。n2.事件相互独立。n3.描述在某一时间或空间段出现的次数。n4.每个时间段发生的次数从0到无穷大。n5.每个时间段中预期发生的次数保持不变。32n泊松分布的例子有:n(1)某电话交换机每分钟接到电话的次数。n(2)每10万人中患有某种罕见疾病的人数。n(3)使用期为一年的个人电脑打印机每个季度的故障次数。n(4)每辆新汽车的喷漆斑点数。n33n二、泊松公式二、泊松公式n对某泊松分布进行长期研究,就可以得到长期的平均值,用 表示。n泊松公式:!xexPx泊松公式用来计算对于给定的 值在某一时间段内某事
11、件发生的概率。34其中,x:要计算的概率的时间段内发生的次数。X1,2,3,。:长期平均值。e:自然对数的底。e2.718282。35【案 例】n 北京银行某营业部的统计人员经过长期观察发现,在工作日的下午平均每4分钟就有3.2名顾客到达该银行。该统计人员根据这一数据想做如下几项研究:n(1)在一个工作日下午,4分钟时间内恰有5名顾客到达该银行的概率是多少?n(2)在一个工作日下午,4分钟时间内有7名以上顾客到达该银行的概率是多少?n(3)在一个工作日下午,8分钟时间内恰有10名顾客到达该银行的概率是多少?36n问题(1)1141.01200408.054.3355718282.22.3!2.
12、35!xexPx 【统计分析】计算结果表明,该银行在平均每4分钟有3.2名顾客到达的情况下,37【思考】n 如果你是该银行的经理,当你得到这样一个统计分析报告后,会做出什么决策呢?38n问题(2)n分析:要知道在一个工作日下午4分钟时间内有7名以上顾客到达该银行的概率是多少,理论上要计算x=8,9,10,的值。事实上,只要计算到对于 3.2,概率等于0时所对应的x值即可。将它们相加,得到x7的概率。39 0000.0!13718282.22.32.3132.313xP 0040.0!9718282.22.32.392.39xP 0013.0!10718282.22.32.3102.310 xP
13、 0004.0!11718282.22.32.3112.311xP 0001.0!12718282.22.32.3122.312xP 0111.0!8718282.22.32.382.38xP400169.087xPxP 【统计分析】计算结果表明,该银行在平均每4分钟有3.2名顾客到达的情况下,41n问题(3)n分析:这个问题与前面两个问题不同,因为 的间隔与x的间隔不同。这时,需要将两个间隔调整为相同。n调整的方法是,将 的值调整为与x有相同的间隔。n此处x的间隔为8分钟,所以应当将 的间隔也调整为8分钟。n既然一个工作日下午4分钟时间内有3.2名顾客到达该银行,那么,8分钟约有6.4名顾客
14、到达该银行。42n同理,如果x的间隔为2分钟,则应将 的间隔由4分钟调整为2分钟1.6人。n问题(3)的答案是:0528.0!10718282.24.68/108/108/4.64.610 xPx分钟名顾客分钟名顾客【统计分析】计算结果表明,该银行在平均每8分钟有6.4名顾客到达时,43n三、泊松分布表的使用三、泊松分布表的使用nP469表7(机械版)n案例中问题(1),x5,2.31140.02.3/5xP44n四、泊松分布的均值和标准差四、泊松分布的均值和标准差n泊松分布的期望值n泊松分布的标准差n【例如】案例中,泊松分布的期望值为3.2人,标准差为1.79()。79.12.3 45n五、
15、运用泊松分布解决涉及长度或间隔的案例五、运用泊松分布解决涉及长度或间隔的案例n事件:事件:观察京藏高速公路某一部分路面重观察京藏高速公路某一部分路面重新铺过新铺过1个月后又出现损坏的情况。个月后又出现损坏的情况。n条件:条件:(1)假定在这段高速路上任何两个)假定在这段高速路上任何两个相等长度间隔内路面损坏出现或不出现的相等长度间隔内路面损坏出现或不出现的概率相等。概率相等。n (2)假定任何一段长度间隔内路面损)假定任何一段长度间隔内路面损坏出现或不出现与另一段长度间隔内路面坏出现或不出现与另一段长度间隔内路面损坏出现或不出现相互独立。损坏出现或不出现相互独立。46n背景:背景:经了解每公里
16、路面重新铺过1个月后出现损坏处的平均数是2处。n问题:问题:求3公里长的高速路上没有出现损坏的概率。n分析:分析:在此问题中,我们感兴趣的是nx=在3公里长的高速路上出现损坏的次数为0。n 63247n利用泊松公式:0025.0071828.266/060!xxpx【统计分析】上述计算结果表明,在3公里的高速路上没有损坏几乎是不可能的。换句话说,在高速路的这部分路面上,至少有1处损坏的概率是 1-0.0025=0.9975。48【思考】n 假如你是京藏高速公路管理处负责路面维修的人员,当你得到这样一个统计信息后,该如何做呢?49利用Excel解决泊松分布和累积泊松分布的问题n1.选择“粘贴函数
17、”fxn2.在“选择类别”框统计n3.在“选择函数”框POISSONn4.在第一个框中输入X值,在第二个框中输入 值,在第三个框输入false(单个概率)或true(累积概率)50第四节第四节 超几何概率分布超几何概率分布n 一、超几何分布(Hypergeometric distribution)与二项分布关系密切,统计学家经常用它来补充分析二项分布。n 二者之间的联系与区别:51二项分布超几何分布离散型分布每个结果包括成功或失败每次实验成功的概率相同每次实验之间相互独立(放回实验)总体是无限的总体中成功的数目未知离散型分布每个结果包括成功或失败每次实验成功的概率不同每次实验之间相互不独立(无
18、放回实验)总体是有限的,并已知总体中成功的数目已知52n二、超几何概率函数 rxnNxnrNxrxf0F(x):n次子实验中成功x次的概率n:子实验的次数N:总体中单位(元素)个数r:总体中成功元素的次数的样本的方法数中选取容量为:从总体nNnNnNnN!53次失败的方法数次失败的样本中选取(:从总体中共有次成功的方法数次成功的样本中选取从总体中共有):xnrNxnrNxrxr54案例:n 假设北京主要的18家计算机公司中,有12家位于中关村。采用无放回抽样方法,从18家公司中随机抽取3家,问:n (1)其中恰有1家位于中关村的概率是多少?n (2)其中至少有1家位于中关村的概率是多少?55n解答:n(1)已知:N18,n=3,r=12,x=1 2206.031826112nNxnrNxrxf56n(2)本问包括3种情况:nx1,x=2,x=39755.02696.04853.02206.03180631231816212318261121xf57利用Excel计算超几何概率分布的概率n1.选择“粘贴函数”fxn2.在“选择类别”框统计n3.在“选择函数”框HYPGEOMDISTn4.在第一个框中输入样本中成功的次数X值,在第二个框中输入样本容量n值,在第三个框输入总体成功的次数r值,在第四个框中输入总体大小N值。n5.确定
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。