1、离散型随机变量的均值与方差、正离散型随机变量的均值与方差、正 态分布态分布 考试要求 1.理解取有限个值的离散型随机变量的均值、方差的概念. 2.会求简单离散型随机变量的均值、方差,并能利用离散型随机变量的均值、 方差概念解决一些简单实际问题. 3.借助频率直方图认识正态分布曲线的特点及曲线所表示的意义 1离散型随机变量的分布列、均值与方差 一般地,若离散型随机变量 X 的分布列为 X x1 x2 xi xn P p1 p2 pi pn (1)均值: 称 E(X)x1p1x2p2xipixnpn为随机变量 X 的均值或数学 期望,它反映了离散型随机变量取值的平均水平 (2)方差:称 D(X)
2、n i1xiE(X) 2pi 为随机变量 X 的方差,它刻画了随机变量 X 与其均值 E(X)的平均偏离程度,其算术平方根 DX为随机变量 X 的标准差 2均值与方差的性质 (1)E(aXb)aE(X)b. (2)D(aXb)a2D(X)(a,b 为常数) 3两点分布与二项分布的均值、方差 均值 方差 变量 X 服从两点分布 E(X)p D(X)p(1p) XB(n,p) E(X)np D(X)np(1p) 4.正态分布 (1)正态曲线的特点: 曲线位于 x 轴上方,与 x 轴不相交; 曲线是单峰的,它关于直线 x 对称; 曲线在 x 处达到峰值 1 2; 曲线与 x 轴之间的面积为 1; 当
3、 一定时,曲线的位置由 确定,曲线随着 的变化而沿 x 轴平移; 当 一定时,曲线的形状由 确定, 越小,曲线越“瘦高”,表示总体的 分布越集中; 越大,曲线越“矮胖”,表示总体的分布越分散 (2)正态分布的三个常用数据 P(X)0.682 7; P(2X2)0.954 5; P(3X3)0.997 3. 常用结论 1均值与方差的关系:D(X)E(X2)E2(X) 2 超几何分布的均值: 若 X 服从参数为 N, M, n 的超几何分布, 则 E(X)nM N . 一、易错易误辨析(正确的打“”,错误的打“”) (1)离散型随机变量的各个可能值表示的事件是彼此互斥的 ( ) (2)若 XN(,
4、2),则 ,2分别表示正态分布的均值和方差 ( ) (3)随机变量的方差和标准差都反映了随机变量取值偏离均值的平均程度,方 差或标准差越小,则偏离均值的平均程度越小. ( ) 答案 (1) (2) (3) 二、教材习题衍生 1已知 X 的分布列为 X 1 0 1 P 1 2 1 3 a 设 Y2X3,则 E(Y)的值为( ) A7 3 B4 C1 D1 A 由概率分布列的性质可知:1 2 1 3a1, a1 6. E(X)(1)1 20 1 31 1 6 1 3. E(Y)32E(X)32 3 7 3. 2若离散型随机变量 X 的分布列为 X 0 1 P a 2 a2 2 则 X 的方差 D(
5、X) . 1 4 由 a 2 a2 2 1 得 a1 或2(舍去) X 的分布列为 X 0 1 P 1 2 1 2 D(X)1 2 11 2 1 4. 3已知随机变量 X 服从正态分布 N(3,1),且 P(X2c1)P(X2c1)P(Xc3), 2c1c332,c4 3. 4甲、乙两工人在一天生产中出现的废品数分别是两个随机变量 X,Y,其分 布列分别为: X 0 1 2 3 P 0.4 0.3 0.2 0.1 Y 0 1 2 P 0.3 0.5 0.2 若甲、乙两人的日产量相等,则甲、乙两人中技术较好的是 乙 E(X)0 0.41 0.32 0.23 0.11.E(Y)0 0.31 0.5
6、2 0.2 0.9,因为 E(Y)E(X),所以乙技术好 考点一 求离散型随机变量的均值、方差 求离散型随机变量 X 的均值与方差的步骤 (1)理解 X 的意义,写出 X 可能取的全部值 (2)求 X 取每个值时的概率 (3)写出 X 的分布列 (4)由均值的定义求 E(X) (5)由方差的定义求 D(X) 典例 1 为迎接 2022 年北京冬奥会, 推广滑雪运动, 某滑雪场开展滑雪促销 活动该滑雪场的收费标准是:滑雪时间不超过 1 小时免费,超过 1 小时的部分 每小时收费标准为 40 元(不足 1 小时的部分按 1 小时计算)有甲、乙两人相互独 立地来该滑雪场运动,设甲、乙不超过 1 小时
7、离开的概率分别为1 4, 1 6;1 小时以上 且不超过 2 小时离开的概率分别为1 2, 2 3;两人滑雪时间都不会超过 3 小时 (1)求甲、乙两人所付滑雪费用相同的概率; (2)设甲、乙两人所付的滑雪费用之和为随机变量 (单位:元),求 的分布列 与数学期望 E(),方差 D() 解 (1)两人所付费用相同,相同的费用可能为 0,40,80 元,两人都付 0 元的 概率为 p11 4 1 6 1 24, 两人都付 40 元的概率为 p21 2 2 3 1 3, 两人都付 80 元的概率为 p3 11 4 1 2 11 6 2 3 1 4 1 6 1 24, 则两人所付费用相同的概率为 p
8、p1p2p3 1 24 1 3 1 24 5 12. (2)由题设甲、乙所付费用之和为 , 可能取值为 0,40,80,120,160,则: P(0)1 4 1 6 1 24; P(40)1 4 2 3 1 2 1 6 1 4; P(80)1 4 1 6 1 2 2 3 1 4 1 6 5 12; P(120)1 2 1 6 1 4 2 3 1 4; P(160)1 4 1 6 1 24. 的分布列为 0 40 80 120 160 P 1 24 1 4 5 12 1 4 1 24 E()0 1 2440 1 480 5 12120 1 4160 1 2480. D()(080)2 1 24(
9、4080) 21 4(8080) 25 12(12080) 21 4(160 80)2 1 24 4 000 3 . 点评: (1)求离散型随机变量的均值与方差关键是确定随机变量的所有可能值, 写出随机变量的分布列,正确运用均值、方差公式进行计算 (2)注意 E(aXb)aE(X)b,D(aXb)a2D(X)的应用 跟进训练 1某群体中的每位成员使用移动支付的概率都为 p,各成员的支付方式相互 独立 设 X 为该群体的 10 位成员中使用移动支付的人数, D(X)2.4, P(X4)P(X 6),则 p( ) A0.7 B0.6 C0.4 D0.3 B 由题意知,该群体的 10 位成员使用移动
10、支付的概率分布符合二项分布, 所以 D(X)10p(1p)2.4,所以 p0.6 或 p0.4.由 P(X4)P(X6),得 C 4 10p4(1 p)6C 6 10p6(1p)4,即(1p)20.5,所以 p0.6. 2随机抽取某厂的某种产品 200 件,经质检,其中一等品 126 件,二等品 50 件,三等品 20 件,次品 4 件已知生产 1 件一、二、三等品获得的利润分别为 6 万元、2 万元、1 万元,而 1 件次品亏损 2 万元,设 1 件产品的利润(单位:元)为 X. (1)求 X 的分布列; (2)求 1 件产品的平均利润(即 X 的数学期望); (3)经技术革新后,仍有四个等
11、级的产品,但次品率降为 1%,一等品率提高为 70%,如果此时要求 1 件产品的平均利润不小于 4.73 万元,则三等品率最多是多 少? 解 (1)X 的所有可能取值有 6,2,1,2. P(X6)126 2000.63, P(X2) 50 2000.25,P(X1) 20 2000.1, P(X2) 4 2000.02. 故 X 的分布列为: X 6 2 1 2 P 0.63 0.25 0.1 0.02 (2)E(X)60.6320.2510.1(2)0.024.34. (3)设技术革新后的三等品率为 x,则此时 1 件产品的平均利润为 E(X)60.72(10.70.01x)1x(2)0.
12、01 4.76x(0 x0.29) 依题意,E(X)4.73, 即 4.76x4.73, 解得 x0.03,所以三等品率最多为 3%. 考点二 均值与方差在决策中的应用 利用均值、方差进行决策的两个方略 (1)当均值不同时,两个随机变量取值的水平可见分歧,可对问题作出判断 (2)若两随机变量均值相同或相差不大则可通过分析两变量的方差来研究随 机变量的离散程度或者稳定程度,进而进行决策 典例 2(2020 郑州市第一次质量预测)水污染现状与工业废水排放密切相关, 某工厂深入贯彻科学发展观,努力提高污水收集处理水平,其污水处理程序如下: 原始污水必先经过 A 系统处理,处理后的污水(A 级水)达到
13、环保标准(简称达标)的 概率为 p(0p1)经化验检测,若确认达标便可直接排放;若不达标则必须经过 B 系统处理后直接排放 该工厂现有 4 个标准水量的 A 级水池,分别取样、检测多个污水样本检测 时,既可以逐个化验,也可以将若干个样本混合在一起化验混合样本中只要有 样本不达标,则混合样本的化验结果必不达标若混合样本不达标,则该组中各 个样本必须再逐个化验;若混合样本达标,则原水池的污水直接排放 现有以下四种方案: 方案一:逐个化验; 方案二:平均分成两组化验,且每组两个样本混在一起化验; 方案三:三个样本混在一起化验,剩下的一个单独化验; 方案四:四个样本混在一起化验 化验次数的期望值越小,
14、则方案越“优” (1)若 p2 2 3 ,求 2 个 A 级水样本混合化验结果不达标的概率 (2)若 p2 2 3 ,现有 4 个 A 级水样本需要化验,请问:方案一、二、四中哪 个最“优”? 若方案三比方案四更“优”,求 p 的取值范围 解 (1)该混合样本达标的概率是 2 2 3 2 8 9, 根据对立事件知,不达标的概率为 18 9 1 9. (2)方案一:逐个化验,化验次数为 4. 方案二: 由(1)知, 每组两个样本化验时, 若均达标则化验次数为 2, 概率为 8 9 2 64 81;若一组达标,另一组不达标则化验次数为 4,概率为 C 1 28 9 1 9 16 81;若两 组均不
15、达标则化验次数为 6,概率为 1 9 2 1 81.记方案二的化验次数为 2,则 2 的可 能取值为 2,4,6, 其分布列如下, 2 2 4 6 P 64 81 16 81 1 81 可求得方案二的期望为 E(2)264 814 16 816 1 81 198 81 22 9 . 方案四:混在一起化验,记化验次数为 4,则 4可取 1,5, 其分布列如下, 4 1 5 P 64 81 17 81 可求得方案四的期望为 E(4)164 815 17 81 149 81 . 比较可得 E(4)E(2)4,故方案四最“优” 方案三:设化验次数为 3,则 3可取 2,5, 3 2 5 P p3 1p
16、3 E(3)2p35(1p3)53p3; 方案四:设化验次数为 4,则 4可取 1,5, 4 1 5 P p4 1p4 E(4)p45(1p4)54p4. 由题意得 E(3)E(4)53p354p4p3 4. 故当 0p3 4时,方案三比方案四更“优” 点评:随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变 量稳定于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于 方案取舍的重要理论依据一般先比较均值,若均值相同,再用方差来决定 跟进训练 某种大型医疗检查机器生产商,对一次性购买 2 台机器的客户,推出两种超 过质保期后两年内的延保维修优惠方案: 方案一:交纳延保金
17、7 000 元,在延保的两年内可免费维修 2 次,超过 2 次每 次收取维修费 2 000 元; 方案二:交纳延保金 10 000 元,在延保的两年内可免费维修 4 次,超过 4 次 每次收取维修费 1 000 元 某医院准备一次性购买 2 台这种机器现需决策在购买机器时应购买哪种延 保方案,为此搜集并整理了 50 台这种机器超过质保期后延保两年内维修的次数, 得下表: 维修次数 0 1 2 3 台数 5 10 20 15 以这 50 台机器维修次数的频率代替 1 台机器维修次数发生的概率记 X 表示 这 2 台机器超过质保期后延保的两年内共需维修的次数 (1)求 X 的分布列; (2)以所需
18、延保金及维修费用的期望值为决策依据,医院选择哪种延保方案更 合算? 解 (1)X 所有可能的取值为 0,1,2,3,4,5,6. P(X0) 1 10 1 10 1 100, P(X1) 1 10 1 52 1 25, P(X2)1 5 1 5 2 5 1 102 3 25, P(X3) 1 10 3 102 1 5 2 52 11 50, P(X4)2 5 2 5 3 10 1 52 7 25, P(X5)2 5 3 102 6 25, P(X6) 3 10 3 10 9 100, X 的分布列为 X 0 1 2 3 4 5 6 P 1 100 1 25 3 25 11 50 7 25 6
19、25 9 100 (2)选择延保方案一,所需费用 Y1元的分布列为: Y1 7 000 9 000 11 000 13 000 15 000 P 17 100 11 50 7 25 6 25 9 100 E(Y1) 17 1007 000 11 509 000 7 2511 000 6 2513 000 9 10015 00010 720(元) 选择延保方案二,所需费用 Y2元的分布列为: Y2 10 000 11 000 12 000 P 67 100 6 25 9 100 E(Y2) 67 10010 000 6 2511 000 9 10012 000 10 420(元) E(Y1)E(
20、Y2),该医院选择延保方案二较合算 考点三 正态分布 关于正态总体在某个区间内取值的概率求法 (1)熟记 P(X),P(2X2),P(3X3)的值 (2)充分利用正态曲线的对称性和曲线与 x 轴之间面积为 1.正态曲线关于直 线 x 对称,从而在关于 x 对称的区间上概率相等;P(Xa)1P(Xa), P(Xa)P(Xa) 典例 3 为了监控某种零件的一条生产线的生产过程,检验员每天从该生产 线上随机抽取 16 个零件,并测量其尺寸(单位:cm)根据长期生产经验,可以认 为这条生产线正常状态下生产的零件的尺寸服从正态分布 N(,2) (1)假设生产状态正常,记 X 表示一天内抽取的 16 个零
21、件中其尺寸在(3, 3)之外的零件数,求 P(X1)及 X 的数学期望; (2)一天内抽检零件中,如果出现了尺寸在(3,3)之外的零件,就认为 这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行 检查 试说明上述监控生产过程方法的合理性; 下面是检验员在一天内抽取的 16 个零件的尺寸: 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95 经 计 算 得x 1 16 xi 9.97 , s )0.212,其中 xi为抽取的第 i 个零件的尺寸,i1,2
22、, 16. 用样本平均数x作为 的估计值 ,用样本标准差 s 作为 的估计值,利用 估计值判断是否需对当天的生产过程进行检查?剔除( 3,3)之外的数据, 用剩下的数据估计 和 (精确到 0.01) 附: 若随机变量 Z 服从正态分布 N(, 2), 则 P(3Z3)0.997 4,0.997 4160.959 2, 0.0080.09. 解 (1)抽取的一个零件的尺寸在(3,3)之内的概率为 0.997 4,从而 零件的尺寸在(3,3)之外的概率为 0.002 6,故 XB(16,0.002 6) 因此 P(X1)1P(X0)10.997 4160.040 8. X 的数学期望 E(X)16
23、0.002 60.041 6. (2)如果生产状态正常, 一个零件尺寸在(3, 3)之外的概率只有 0.002 6,一天内抽取的 16 个零件中,出现尺寸在(3,3)之外的零件的概率只有 0.040 8,发生的概率很小,因此一旦发生这种情况,就有理由认为这条生产线在 这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上 述监控生产过程的方法是合理的 由 x 9.97,s0.212,得 的估计值为 9.97, 的估计值为0.212, 由样本数据可以看出有一个零件的尺寸在( 3,3)之外,因此需对当天的生 产过程进行检查 剔除( 3,3)之外的数据 9.22,剩下数据的平均数为1
24、 15(169.97 9.22)10.02. 因此 的估计值为 10.02. x2i160.2122169.9721 591.134, 剔除( 3,3)之外的数据 9.22,剩下数据的样本方差为1 15(1 591.134 9.2221510.022)0.008, 因此 的估计值为 0.0080.09. 点评:本题考查正态分布、概率统计问题的综合,是在知识网络的交汇处命 制的一道较为新颖的试题正态分布与统计案例有些知识点是所谓的高考“冷 点”,由于考生对这些“冷点”的内容重视不够,复习不全面,一旦这些“冷点” 知识出了考题,虽然简单但也做错,甚至根本不会做,因而错误率相当高本题 求解的关键是借
25、助题设提供的数据对问题做出合理的分析,其中方差公式的等价 变形是数据处理的关键点 跟进训练 1.在如图所示的正方形中随机投掷 10 000 个点,则落入阴影部分(曲线 C 为正 态分布 N(1,1)的密度曲线)的点的个数的估计值为( ) 附:若 XN(,2),则 P(X )0.682 7,P(2X2) 0.954 5. A1 193 B1 359 C2 718 D3 413 B 对于正态分布 N(1,1),1,1,正态曲线关于 x1 对称,故 题图中阴影部分的面积为1 2P(3X1)P(2X0) 1 2P(2X 2)P(X)1 2(0.954 50.682 7)0.135 9, 所以点落入题图
26、中阴 影部分的概率 P0.135 9 1 0.135 9,投入 10 000 个点,落入阴影部分的个数约为 10 0000.135 91 359. 2为评估设备 M 生产某种零件的性能,从设备 M 生产零件的流水线上随机 抽取 100 个零件作为样本,测量其直径后,整理得到下表: 直径/mm 58 59 61 62 63 64 65 66 个数 1 1 3 5 6 19 33 18 直径/mm 67 68 69 70 71 73 合计 个数 4 4 2 1 2 1 100 经计算,样本直径的平均值 65,标准差 2.2,以频率值作为概率的估计 值 (1)为评判一台设备的性能,从该设备加工的零件
27、中任意抽取一件,记其直径 为 X,并根据以下不等式进行评判(P 表示相应事件的概率):P(X )0.682 7;P(2X2)0.954 5;P(3X3)0.997 3.评 判规则为:若同时满足上述三个不等式,则设备等级为甲;若仅满足其中两个, 则等级为乙;若仅满足其中一个,则等级为丙;若全部都不满足,则等级为丁, 试判断设备 M 的性能等级 (2)将直径小于等于 2 或直径大于 2 的零件认为是次品 从设备 M 的生产流水线上随机抽取 2 件零件,计算其中次品件数 Y 的数学 期望 E(Y); 从样本中随机抽取 2 件零件,计算其中次品件数 Z 的数学期望 E(Z) 解 (1)P(X)P(62.80.682 7,P(2X 2)P(60.6X69.4)0.940.954 5, P(3X3)P(58.4X71.6)0.980.997 3, 因为设备 M 的数据仅满足一个不等式,故其性能等级为丙 (2)易知样本中次品共 6 件,可估计设备 M 生产零件的次品率为 0.06. 由题意可知 YB()2,0.06 ,于是 E(Y)20.060.12. 由题意可知 Z 的分布列为 Z 0 1 2 P C294 C2100 C16C194 C2100 C26 C2100 故 E(Z)0 C294 C21001 C16C194 C2100 2 C26 C2100 3 25.
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。