1、第七章 随机变量及其分布基础知识知识点一概率乘法公式由条件概率的定义,任意两个事件A与B ,若P(A)0,则,我们称上式为概率的_公式.知识点二全概率公式一般地,设A1,A2,An是一组两两_的事件,A1A2An,且P(Ai)0,i1,2,n,则对任意的事件B,有P(B)(Ai)P(B|Ai),我们称该公式为_知识点三贝叶斯公式设A1,A2,An是一组两两_的事件,A1A2An,且P(Ai)0,i1,2,n,则对任意的事件B,P(B)0,有P(Ai|B),i1,2,n.知识点四离散型随机变量的分布列及其性质1定义:一般地,设离散型随机变量X的可能取值为x1,x2,xn,我们称X取每一个值xi的
2、概率P(Xxi)pi,i1,2,3,_为X的概率分布列,简称分布列2分布列的性质(1)pi0,i1,2,n.(2)p1p2pn1.知识点五离散型随机变量的均值与样本平均值之间的关系均值是随机变量可能_关于取值概率的加权平均数,它综合随机变量的取值和取值的概率,反映随机变量取值的_水平若YaXb,其中a,b是常数(X是随机变量),则Y也是随机变量,且有E(aXb)aE(X)b.如下:如果YaXb,其中a,b为常数,X是随机变量,那么Y也是随机变量因此P(Yaxib)P(Xxi),i1,2,3,n,所以Y的分布列为Yax1bax2baxibaxnbPp1p2pipn于是E(Y)(ax1b)p1(a
3、x2b)p2(axib)pi(axnb)pna(x1p1x2p2xipixnpn)b(p1p2pipn)aE(X)b,即E(aXb)aE(X)b.(1)区别:随机变量的均值是一个常数,不依赖于样本的抽取,样本平均值是一个随机变量,它随样本抽取的不同而变化(2)联系:对于简单的随机样本,随着样本容量的增加,样本平均值越来越接近于总体的均值知识点六 二项分布的均值与方差二项分布的均值与方差(1)二项分布的均值:在n次独立重复试验中,若XB(n,p),则_.(2) 二项分布的方差:若离散型随机变量X从二项分布,即XB(n,p),则_.知识点七 超几何分布的均值设随机变量X服从超几何分布,则X可以解释
4、为从包含M件次品的N件产品中,不放回地随机抽取n件产品中的次品数.令p=MN , 则p是N件产品的次品率,而是抽取的 n件产品的次品率,则E( Xn )=p,即E(X)=np.知识点八 正态曲线的性质:曲线位于轴上方,与轴不_;曲线是_的,它关于直线对称;曲线在时达到峰值;当时,曲线上升;当时,曲线下降.并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近.曲线与轴之间的面积为_;决定曲线的位置和_性;当一定时,曲线的对称轴位置由确定;如下图所示,曲线随着的变化而沿轴_。确定曲线的形状;当一定时,曲线的形状由确定。越_,曲线越“_”,表示总体的分布越集中;越大,曲线越“矮胖”,表示总
5、体的分布越_。课后小练1.三一重工生产了一种新型挖掘机,在推广期邀请了100位客户试用该产品,每人一台.试用一个月之后进行回访,由客户先对产品性能作出“满意”或“不满意”的评价,再让客户决定是否购买该试用产品(不购买则可以免费退货,购买则仅需付成本价).经统计,决定退货的客户人数是总人数的一半,“对性能满意”的客户比“对性能不满意”的客户多10人,“对性能不满意的客户中恰有 23 选择了退货. 附: K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d) ,其中 n=a+b+c+d .P(K2k0) 0.1500.1000.0500.0250.010k0 2.0722.7063.84
6、15.0246.635(1)请完成下面的 22 列联表,并判断是否有99%的把握认为“客户购买该茶与对产品满意之间有关”. 对性能满意对性能不满意合计购买该挖掘机不购买该挖掘机合计(2)企业为了改进产品性能,现从“对性能不满意”的客户中按是否购买产品进行分层抽样,随机抽取6位客户进行座谈.座谈后安排了抽奖环节,共有6张奖券,其中一张印有1000元字样,两张印有600元字样,三张印有200元字样,抽到奖券可获得相应奖金.6位客户每人随机抽取一张奖券(不放回),设6位客户中购买产品的客户人均所得奖金为 X 元,求 X 的分布列和数学期望. 2.美团外卖和百度外卖两家公司其“骑手”的日工资方案如下:
7、美团外卖规定底薪70元,每单抽成1元;百度外卖规定底薪100元,每日前45单无抽成,超出45单的部分每单抽成6元,假设同一公司的“骑手”一日送餐单数相同,现从两家公司个随机抽取一名“骑手”并记录其100天的送餐单数,得到如下条形图: ()求百度外卖公司的“骑手”一日工资 y (单位:元)与送餐单数 n 的函数关系;()若将频率视为概率,回答下列问题:记百度外卖的“骑手”日工资为 X (单位:元),求 X 的分布列和数学期望;小明拟到这两家公司中的一家应聘“骑手”的工作,如果仅从日收入的角度考虑,请你利用所学的统计学知识为他作出选择,并说明理由.3.2020年1月15日教育部制定出台了关于在部分
8、高校开展基础学科招生改革试点工作的意见( 也称“强基计划”),意见宣布:2020年起不再组织开展高校自主招生工作,改为实行强基计划.强基计划上要选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生.据悉强基计划的校考由试点高校自主命题,校考过程中通过笔试后才能进入面试环节.已知甲、乙两所大学的笔试环节都设有三门考试科目且每门科目是否通过相互独立.若某考生报考甲大学,每门科目通过的概率均为 12 ,该考生报考乙大学,每门科目通过的概率依次为 16,23,m ,其中 0m6.635 所以,有99%的把握认为“客户购买产品与对产品性能满意之间有关”.(2)解:由题意知:参加座谈的购买
9、产品的人数为2,退货的人数为4. X 的取值为:200,400,600,800,P(X=200)=A32A62=15 ,P(X=400)=C21C31A22A62=25 ,P(X=600)=A22A62+C11C31A22A62=415 ,P(X=800)=C11C21A22A62=215 ,所以 X 的分布列为X 200400600800P 15 25 415 215 E(X)=20015+40025+600415+800215=14003 所以,购买产品的客户人均所得奖金的数学期望为 14003 元.【解析】 (1)设“对性能满意”的客户为x人,列方程求出x的值,由此填写列联表,计算K2
10、, 对照临界值得出结论; (2)根据分层抽样法抽取6位客户,购买产品抽取2人,知X的可能取值为 200,400,600,800,计算对应的概率值,写出分布列,求出数学期望值2.【答案】 解:(I) y=100(n45,nN*)6n-170(n45,nN*) (II)X 100106118130P 0.20.30.40.1E(X)=1000.2+1060.3+1180.4+1300.1=112 (元)美团外卖“骑手”日平均送餐单数为: 420.2+440.4+460.2+480.1+500.1=45 所以美团外卖“骑手”日平均工资为: 70+451=115 (元)由知,百度外卖“骑手”日平均工资
11、为112元. 故推荐小明去美团外卖应聘.【解析】()当送餐单数n45,nN*时,百度外卖公司的“骑手”一日工资y=100,当送餐单数n45,nN*时,百度外卖公司的“骑手”一日工资y=100+(n-45)6=6n-170,nN*,由此能求出百度外卖公司的“骑手”一日工资y(单位:元)与送餐单数n的函数关系 ()记百度外卖的“骑手”日工资为X(单位:元),由条形图得X的可能取值为100,106,118,130,分别求出相应的概率,由此能求出X的分布列和E(X) 先求出美团外卖“骑手”日平均送餐单数,再求出美团外卖“骑手”日平均工资和百度外卖“骑手”日平均工资为112元由此推荐小明去美团外卖应聘3
12、.【答案】 (1)解:设该考生报考甲大学恰好通过一门笔试科目为事件 A ,则 P(A)=C31(12)(12)2=38 , 该考生报考乙大学恰好通过一门笔试科目为事件 B ,则 P(B)=16(13)2+5623132=2154=718 (2)解:设该考生报考甲大学通过的科目数为 X ,根据题意可知, XB(3,12) ,则 E(X)=312=32 , 报将乙大学通过的科目数为 Y ,随机变量 Y 满足概率为:P(Y=0)=5613(1-m)=518(1-m) ,P(Y=1)=1613(1-m)+5623(1-m)+5613m=1118-13m ,P(Y=2)=1623(1-m)+1613m+
13、5623m=19+12m ,P(Y=3)=1623m=19m ,随机变量 Y 的分布列:Y 0 1 2 3 P 518(1-m) 1118-13m 19+12m 19m E(Y)=1118-13m+29+m+13m=56+m ,因为该考生更希望通过乙大学的笔试, E(Y)E(X) ,则 56+m32 ,所以 m 的范围为: 23m15.945 ,则方案二的工作量更少【解析】(1)设事件A为 “核酸检测呈阳性”,事件B为“患疾病”,利用条件概率公式求解即可;(2)设方案一和方案二中每组的检测次数为X,Y,分别求出两种方案检测次数的分布列,进而得出期望,通过比较期望的大小即可得出结论.5.【答案】
14、 (1)解:从300人中抽取60人,其中“年龄达到35岁”的有 10060300=20 人,再将这20人用分层抽样法按“是否经常使用单车”进行名额划分,其中“年龄达到35岁且偶尔使用单车”的人数为 2045100=9 . A 组这4人中得到礼品的人数 X 的可能取值为0,1,2,3,相应概率为:P(X=0)=C53C93=542 , P(X=1)=C41C52C93=1021 ,P(X=2)=C42C51C93=514 , P(X=3)=C43C93=121 .故其分布列为X 0123P 542 1021 514 121 E(X)=0542+11021+2514+3121=43 (2)解:按“
15、年龄是否达到35岁”对数据进行整理,得到如下列联表: 经常使用单车偶尔使用单车合计未达到35岁12575200达到35岁5545100合计180120300m=35 时,由(1)中的列联表,可求得 K2 的观测值k1=300(12545-7555)2200100180120=30015002200100180120=2516 .m=25 时,按“年龄是否达到25岁”对数据进行整理,得到如下列联表:经常使用单车偶尔使用单车合计未达到25岁6733100达到25岁11387200合计180120300可求得 K2 的观测值k2=300(6787-11333)2200100180120=300210
16、02200100180120=4916 . k2k1 ,欲使犯错误的概率尽可能小,需取 m=25 【解析】(1) 根据分层抽样要求,先求从300人中抽取60人,其中“年龄达到35岁”的人数 10060300 ,再求“年龄达到35岁” 中偶尔使用单车的人数 2045100 ; 确定随机变量X的取值,计算X各个取值的概率,得分布列及数学期望.(2)对年龄m是否达到35,m是否达到25对数据重新整理(2 2联表),根据公式计算相应的 K2 ,比较大小确定.6.【答案】 (1)解: (0.25+0.5+2a+1+1.75)0.2=1 ,所以 a=0.75 , 视力在4.4以下的频率为: (0.5+0.
17、75)0.2=0.25 ,视力在4.6以下的频率为: (0.5+0.75+1.75)0.2=0.6 ,所以中位数在4.4至4.6之间,设中位数为x,则 (x-4.4)1.75=0.5-0.25 , x4.54 ,故中位数为4.54(2)解:因为 K2 的观测值 k=100(4218-832)250507426=25004815.23.841 所以有95%把握认为视力与学习成绩有关(3)解:视力在4.8以上的同学中,视力在5.0以上的同学所占的比例为: 0.250.25+0.75=14 所以从全市视力在4.8以上的同学中随机抽取4名同学,这4名同学中有资格报该校该专业的人数为 XB(4,14)
18、,即 P(X=k)=C4k(14)k(34)4-k , k=0,1,2,3,4 .所以 P(X=0)=(34)4=81256 ,P(X=1)=C4114(34)3=108256=2764 ,P(X=2)=C42(14)2(34)2=54256=27128 ,P(X=3)=C32(14)334=12256=364 ,P(X=4)=(14)4=1256 .所以X的分布列为:X01234P81256 2764 27128 364 1256 E(X)=414=1 【解析】(1) 根据频率之和为1即可求出 a ,再根据频率分布直方图即可估算出中位数;(2) 计算出卡方值,和3.841比较即可判断;(3)可知 X 服从二项分布 XB(4,14) ,即可求出分布列和数学期望.