1、第七讲第七讲 离散型随机变量的分布列、期望与方差离散型随机变量的分布列、期望与方差(理理) 知识梳理 双基自测 知 识 梳 理 知识点一 离散型随机变量 随着试验结果变化而变化的变量称为_随机变量_,所有取值可以一一列出的随机变量, 称为_离散型_随机变量 知识点二 离散型随机变量的分布列及性质 (1)一般地,若离散型随机变量 X 可能取的不同值为 x1,x2,xi,xn,X 取每一个 值 xi(i1,2,n)的概率 P(Xxi)pi,则表 X x1 x2 xi xn P p1 p2 pi pn 称为离散型随机变量 X 的_概率分布列_,简称为 X 的分布列 (2)离散型随机变量的分布列的性质
2、 pi0(i1,2,n); n i1pi_p1p2pn_1 知识点三 离散型随机变量的均值与方差 若离散型随机变量 X 的分布列为 P(Xxi)pi,i1,2,n (1)均值:称 E(X)_x1p1x2p2xipixnpn_为随机变量 X 的均值或数学期望 (2)方差:称 D(X) n i1 (xiE(X) 2p i为随机变量 X 的方差,其算术平方根 DX为随机变 量 X 的_标准差_ (3)均值与方差的性质 E(aXb)_aE(X)b_ D(aXb)_a2D(X)_ *D(X)E(X2)(E(X)2 知识点四 常见离散型随机变量的分布列 (1)两点分布:若随机变量 X 服从两点分布,其分布
3、列为 X 0 1 P 1p p 其中 pP(X1)称为成功概率 若 X 服从两点分布,则 E(X)p,D(X)p(1p) (2)超几何分布:在含有 M 件次品的 N 件产品中,任取 n 件,其中恰有 X 件次品,则 P(X k)C k MC nk NM CnN ,k0,1,2,m,其中 mminM,n,且 nN、MN,n、M、NN, 称随机变量 X 服从超几何分布 X 0 1 m P C0MCn 0 NM CnN C1MCn 1 NM CnN Cm MC nm NM CnN 归 纳 拓 展 1若 X 是随机变量,则 YaXb(a,b 是常数)也是随机变量 2随机变量 所取的值分别对应的事件是两
4、两互斥的 双 基 自 测 题组一 走出误区 1判断下列结论是否正确(请在括号中打“”或“”) (1)抛掷均匀硬币一次,出现正面的次数是随机变量( ) (2)在离散型随机变量的分布列中,随机变量取各个值的概率之和可以小于 1( ) (3)离散型随机变量的各个可能值表示的事件是彼此互斥的( ) (4)由下列给出的随机变量 X 的分布列服从二点分布( ) X 2 5 P 0.3 0.7 (5)从4名男演员和3名女演员中选出4人, 其中女演员的人数X服从超几何分布 ( ) (6)某人射击时命中的概率为 0.5,此人射击三次命中的次数 X 服从两点分布( ) 题组二 走进教材 2(P77A 组 T1 改
5、编)(此题为更换后新题)设随机变量 X 的概率分布列为 X 1 2 3 4 P 1 4 m 1 8 3 8 则 P(|X3|1)_5 8_ 解析 由1 4m 1 8 3 81,解得 m 1 4, P(|X3|1)P(X2)P(X4)1 4 3 8 5 8 2(P77A 组 T1 改编)(此题为发现的重题,更换新题见上题)设随机变量 X 的概率分布列为 X 1 2 3 4 P 1 3 m 1 4 1 6 则 P(|X3|1)_ 5 12_ 解析 由1 3m 1 4 1 61,解得 m 1 4, P(|X3|1)P(X2)P(X4)1 4 1 6 5 12 3(P49A 组 T1)有一批产品共 1
6、2 件,其中次品 3 件,每次从中任取一件,在取到合格品 之前取出的次品数 X 的所有可能取值是_0,1,2,3_ 解析 因为次品共有3件, 所以在取到合格品之前取出的次品数X的可能取值为0,1,2,3 题组三 走向高考 4(2020 浙江)盒中有 4 个球,其中 1 个红球,1 个绿球,2 个黄球从盒中随机取球, 每次取 1 个,不放回,直到取出红球为止设此过程中取到黄球的个数为 ,则 P(0)_1 3 _,E()_1_ 解析 由题意知,随机变量 的可能取值为 0,1,2; 计算 P(0)C 1 1 C14 C11 C11 C14 C13 1 3; P(1)C 1 2 C 1 1 A24 C
7、 1 2C 1 1A 2 2C 1 1 A34 1 3; P(2)A 2 2 C 1 1 A34 C 2 2C 1 1A 3 3C 1 1 A44 1 3; 所以 E()01 31 1 32 1 31 故答案为1 3,1 5(2020 课标,3)在一组样本数据中,1,2,3,4 出现的频率分别为 p1,p2,p3,p4,且 i1 4 p i1,则下面四种情形中,对应样本的标准差最大的一组是( B ) Ap1p40.1,p2p30.4 Bp1p40.4,p2p30.1 Cp1p40.2,p2p30.3 Dp1p40.3,p2p30.2 解析 根据均值 E(X) i1 4 xipi,方差 D(X)
8、 i1 4 xiE(X)2 pi,标准差最大即方差最大,由 各选项对应的方差如下表 选项 均值 E(X) 方差 D(X) A 2.5 0.65 B 2.5 1.85 C 2.5 1.05 D 2.5 1.45 由此可知选项 B 对应样本的标准差最大,故选 B 考点突破 互动探究 考点一 离散型随机变量分布列的性质自主练透 例 1 (1)(2021 河南南阳联考)随机变量 的概率分布规律为 P(Xn) a nn1(n 1,2,3,4),其中 a 为常数,则 P(5 4X 13 4 )的值为( D ) A2 3 B3 4 C4 5 D 5 16 (2)(2021 银川质检)若随机变量 的分布列如表
9、所示,E()1.6,则 ab( B ) 0 1 2 3 P 0.1 a b 0.1 A0.2 B0.2 C0.8 D0.8 解析 (1)P(Xn) a nn1(n1,2,3,4), a 1 12 1 23 1 45 1,即 11 5 a1, a5 4,P 5 4X 13 4 P(X2)P(X3)5 4 1 6 5 4 1 12 5 16 (2)易知 a,b0,1,由 0.1ab0.11,得 ab0.8,由 E()00.11a2b 30.11.6,得 a2b1.3,所以 a0.3,b0.5,则 ab0.2 名师点拨 (1)利用分布列中各概率之和为 1 可求参数的值,要注意检查每个概率值均为非负数
10、 (2)求随机变量在某个范围内的概率,根据分布列,将所求范围内随机变量对应的概率值 相加即可,其依据是互斥事件的概率加法公式 变式训练 1 (2020 天津和平区期末)设随机变量X的概率分布列如下表, 则随机变量X的数学期望E(X) _9 4_ X 1 2 3 4 P 1 3 m 1 4 1 6 解析 1 3m 1 4 1 61,所以 m 1 4 所以 E(X)11 32 1 43 1 44 1 6 9 4 考点二 离散型随机变量的期望与方差多维探究 例 2 角度 1 期望、方差的简单计算 (1)设随机变量 X 的分布列为 P(Xk)1 6(k1,2,3,4,5,6),则 E(X)_3.5_,
11、E(2X3) _10_,D(X)_35 12_,D(3X1)_ 105 4 _ 解析 E(X)x1p1x2p2x3p3x6p63.5, E(2X3)2E(X)310 D(X)(x1E(X)2p1(x2E(X)2p2(x6E(X)2p6 1 6(13.5) 2(23.5)2(63.5)2 17.51 6 35 12 D(3X1)9D(X)105 4 角度 2 期望、方差与函数性质 (2)(2019 浙江卷,7)设 0a1随机变量 X 的分布列是 X 0 a 1 P 1 3 1 3 1 3 则当 a 在(0,1)内增大时,( D ) AD(X)增大 BD(X)减小 CD(X)先增大后减小 DD(X
12、)先减小后增大 解析 随机变量 X 的期望 E(X)01 3a 1 31 1 3 a1 3 , D(X) 0a1 3 2 aa1 3 2 1a1 3 2 1 3 2 9(a 2a1) 2 9 a1 2 21 6, 当 a 0,1 2 时,D(X)单调递减,当 x 1 2,1 时,D(X)单调递增,故选 D 角度 3 实际问题中的期望、方差问题 (3)(2021 天津红桥区期中)某商场拟通过摸球兑奖的方式对 1 000 位顾客进行奖励, 袋中所 装的 4 个球中有 1 个所标的面值为 50 元,其余 3 个均为 10 元,规定:每位顾客从袋中一次 性随机摸出 2 个球,球上所标的面值之和为该顾客
13、所获的奖励额 求顾客所获的奖励额为 60 元的概率; 求顾客所获的奖励额的分布列及数学期望 解析 设顾客所获取的奖励额为 X, 依题意,得 P (X60)C 1 1 C 1 3 C24 1 2, 即顾客所获得奖励额为 60 元的概率为1 2 依题意得 X 得所有可能取值为 20,60, P(X60)1 2,P(X20) C23 C24 1 2, 即 X 的分布列为 X 20 60 P 1 2 1 2 所以这位顾客所获的奖励额的数学期望为 E(X)201 260 1 240 (4)(入座问题)有编号为 1,2,3,n 的 n 个学生,入座编号为 1,2,3,n 的 n 个座位, 每个学生规定坐一
14、个座位,设学生所坐的座位号与该生的编号不同的学生人数为 X,已知 X 2 时,共有 6 种坐法 (1)求 n 的值; (2)求随机变量 X 的数学期望和方差 解析 (1)由题意知 C2n6,解得 n4 (2)X 所有可能取值为 0,2,3,4, 又 P(X0) 1 A44 1 24, P(X2)C 2 4 A44 6 24 1 4, P(X3) 8 A44 8 24 1 3, P(X4) 9 A44 9 24 3 8, 随机变量 X 的分布列为 X 0 2 3 4 P 1 24 1 4 1 3 3 8 E(X)0 1 242 1 43 1 34 3 83, D(X)(30)2 1 24(32)
15、 21 4(33) 21 3(34) 23 81 名师点拨 求离散型随机变量的分布列、期望与方差,应按下述步骤进行: (1)明确随机变量的所有可能取值以及取每个值所表示的意义; (2)利用概率的有关知识,求出随机变量取每个值的概率; (3)按规范形式写出分布列,并用分布列的性质验证; (4)根据分布列,正确运用期望与方差的定义或公式进行计算 说明:求离散型随机变量的分布列的关键是求随机变量所取值对应的概率,在求解时, 要注意计数原理、排列组合及常见概率模型 变式训练 2 (1)(角度 1)(2021 江苏镇江调研)随机变量 的分布如下表,则 E(54)_13_ 0 2 4 P 0.4 0.3
16、0.3 (2)(角度 2)(2021 广东深圳宝安区调研)设 0a1,离散型随机变量 X 的分布列如下,则 当 a 在 0,2 3 内增大时( D ) X 0 1 2 P 1a 2 1 2 a 2 AD(X)增大 BD(X)减小 CD(X)先减小后增大 DD(X)先增大后减小 (3)如图,A、B 两点由 5 条连线并联,它们在单位时间内能通过的最大信息量依次为 2,3,4,3,2,现记从中任取三条线且在单位时间内都通过的最大信息总量为 写出最大信息总量 的分布列; 求最大信息总量 的数学期望 解析 (1)由题意知 E()20.340.31.8, E(54)5E()413 (2)由题意: E(X
17、)01a 2 11 22 a 2a 1 2, 所以 D(X)1a 2 0a1 2 21 2 1a1 2 2a 2 2a1 2 2a2a1 4 a1 2 21 2, 因为1 2 0,2 3 ,所以 D()先增后减,故选 D (3)由已知, 的取值为 7,8,9,10, P(7)C 2 2C 1 2 C35 1 5, P(8)C 2 2C 1 2C 2 2C 1 1 C35 3 10, P(9)C 1 2C 1 2C 1 1 C35 2 5, P(10)C 2 2C 1 1 C35 1 10 的概率分布列为 7 8 9 10 P 1 5 3 10 2 5 1 10 E()1 57 3 108 2
18、59 1 1010 42 5 8.4 考点三,超几何分布师生共研 例 3 (2017 山东卷改编)在心理学研究中, 常采用对比试验的方法评价不同心理暗 示对人的影响,具体方法如下:将参加试验的志愿者随机分成两组,一组接受甲种心理暗示, 另一组接受乙种心理暗示,通过对比这两组志愿者接受心理暗示后的结果来评价两种心理暗 示的作用,现有 6 名男志愿者 A1,A2,A3,A4,A5,A6和 4 名女志愿者 B1,B2,B3,B4,从 中随机抽取 5 人接受甲种心理暗示,另 5 人接受乙种心理暗示 (1)求接受甲种心理暗示的志愿者中包含 A1但不包含 B1的概率; (2)用 X 表示接受乙种心理暗示的
19、女志愿者人数,求 X 的分布列 解析 (1)记接受甲种心理暗示的志愿者中包含 A1但不包含 B1的事件为 M, 则 P(M) C48 C510 5 18 (2)由题意知 X 可取的值为 0,1,2,3,4,则 P(X0) C56 C510 1 42,P(X1) C46C14 C510 5 21, P(X2)C 3 6C 2 4 C510 10 21,P(X3) C26C34 C510 5 21, P(X4)C 1 6C 4 4 C510 1 42 因此 X 的分布列为 X 0 1 2 3 4 P 1 42 5 21 10 21 5 21 1 42 引申 1用 X 表示接受乙种心理暗示的男志愿者
20、人数,则 X 的分布列为_ 解析 由题意可知 X 的取值为 1,2,3,4,5, 则 P(X1)C 1 6C 4 4 C510 1 42,P(X2) C26C34 C510 5 21, P(X3)C 3 6C 2 4 C510 10 21,P(X4) C46C14 C510 5 21, P(X5) C56 C510 1 42 因此 X 的分布列为 X 1 2 3 4 5 P 1 42 5 21 10 21 5 21 1 42 引申 2用 X 表示接受乙种心理暗示的女志愿者人数与男志愿者人数之差,则 X 的分布列 为_ 解析 由题意知 X 可取的值为 3,1,1,3,5 则 P(X3)C 4 4
21、C 1 6 C510 1 42,P(X1) C34C26 C510 5 21, P(X1)C 2 4C 3 6 C510 10 21,P(X3) C14C46 C510 5 21, P(X5) C56 C510 1 42, 因此 X 的分布列为 X 3 1 1 3 5 P 1 42 5 21 10 21 5 21 1 42 名师点拨 1超几何分布的两个特点: (1)超几何分布是不放回抽样问题; (2)随机变量为抽到的某类个体的个数 2超几何分布的应用:超几何分布属于古典概型,主要应用于抽查产品、摸不同类别的 小球等概率模型 变式训练 3 (2021 安徽省淮北市模拟)有着“中国碳谷”之称的安徽
22、省淮北市,名优特产众多,其中 “塔山石榴”因其青皮软籽、籽粒饱满、晶莹剔透、汁多味甘而享誉天下现调查表明,石 榴的甜度与海拔、日照时长、昼夜温差有着极强的相关性,分别用 a、b、c 表示石榴甜度与海 拔、日照时长、温差的相关程度,并对它们进行量化:0 表示一般,1 表示良,2 表示优,再 用综合指标 abc 的值评定石榴的等级,若 4 则为一级;若 23 则为二级;若 01 则为三级近年来,周边各地市也开始发展石榴的种植,为了了解目前石榴在周边地 市的种植情况,研究人员从不同地市随机抽取了 12 个石榴种植园,得到如下结果: 种植园编 号 A B C D E F (a,b,c) (1,0,0)
23、 (2,2,1) (0,1,1) (2,0,2) (1,1,1) (1,1,2) 种植园编 号 G H I J K L (a,b,c) (2,2,2) (0,0,1) (2,2,1) (0,2,1) (1,2,0) (0,0,2) (1)若有石榴种植园 120 个,估计等级为一级的石榴种植园的数量; (2)在所取样本的二级和三级石榴种植园中任取 2 个, 表示取到三级石榴种植园的数量, 求随机变量 的分布列及数学期望 解析 (1)计算 12 个石榴种植园的综合指标,可得下表 编号 A B C D E F G H I J K L 综合指标 1 5 2 4 3 4 6 1 5 3 3 2 由上表可
24、知等级为一级的有 5 个, 所以等级为一级的频率为 5 12, 所以 120 个石榴种植园中一级种植园约有 50 个 (2)由题意 可以取 0、1、2, 其中 P(0)C 0 2C 2 5 C27 10 21, P(1)C 1 2C 1 5 C27 10 21, P(2)C 2 2C 0 5 C27 1 21, 的分布列为 0 1 2 P 10 21 10 21 1 21 故 E()010 211 10 212 1 21 4 7 名师讲坛 素养提升 离散型随机变量的分布列与统计综合 例 4 (2021 吉林长春实验中学期中)某学校为了解班级卫生教育系列活动的成效, 对全校 40 个班级进行了一
25、次突击班级卫生量化打分检查(满分 100 分,最低分 20 分)根据检 查结果:得分在80,100评定为“优”,奖励 3 面小红旗;得分在60,80)评定为“良”,奖励 2 面小红旗;得分在40,60)评定为“中”,奖励 1 面小红旗;得分在20,40)评定为“差”,不 奖励小红旗已知统计结果的部分频率分布直方图如图: (1)依据统计结果的部分频率分布直方图,求班级卫生量化打分检查得分的中位数; (2)学校用分层抽样的方法,从评定等级为“优”、“良”、“中”、“差”的班级中抽 取 10 个班级,再从这 10 个班级中随机抽取 2 个班级进行抽样复核,记抽样复核的 2 个班级 获得的奖励小红旗面
26、数和为 X,求 X 的分布列与数学期望 E(X) 解析 (1)得分20,40)的频率为 0.005 200.1;得分40,60)的频率为 0.010 200.2;得 分80,100的频率为 0.015200.3;所以得分60,80)的频率为 1(0.10.20.3)0.4 设班级得分的中位数为 x 分,于是 0.10.2x60 20 0.40.5,解得 x70 所以班级卫生量化打分检查得分的中位数为 70 (2)由(1)知题意“优”、“良”、“中”、“差”的频率分别为 0.3,0.4,0.2,0.1又班级 总数为 40于是“优”、“良”、“中”、“差”的班级个数分别为 12,16,8,4分层抽
27、样的 方法抽取的“优”、“良”、“中”、“差”的班级个数分别为 3,4,2,1 由题意可得 X 的所有可能取值为 1,2,3,4,5,6 P(X1)C 1 1C 1 2 C210 2 45,P(X2) C22C11C14 C210 1 9, P(X3)C 1 1C 1 3C 1 2C 1 4 C210 11 45,P(X4) C24C12C13 C210 4 15, P(X5)C 1 4C 1 3 C210 4 15,P(X6) C23 C210 1 15, 所以 X 的分布列为 X 1 2 3 4 5 6 P 2 45 1 9 11 45 4 15 4 15 1 15 E(X)1 2 452
28、 1 93 11 454 4 155 4 156 1 15 171 45 19 5 所以 X 的数学期望 E(X)19 5 变式训练 4 (2021 湖南湘潭模拟)为了解贵州省某州 2020 届高三理科生的化学成绩的情况,该州教育 局组织高三理科生进行了摸底考试,现从参加考试的学生中随机抽取了 100 名理科生,将他 们的化学成绩(满分为 100 分)分为40,50),50,60),60,70),70,80),80,90),90,1006 组, 得到如图所示的频率分布直方图 (1)求 a 的值; (2)记 A 表示事件“从参加考试的所有理科生中随机抽取一名学生,该学生的化学成绩不 低于 70
29、分”,试估计事件 A 发生的概率; (3)在抽取的 100 名理科生中, 采用分层抽样的方法从成绩在60,80)内的学生中抽取 10 名, 再从这 10 名学生中随机抽取 4 名,记这 4 名理科生成绩在60,70)内的人数为 X,求 X 的分布 列与数学期望 解析 (1)(0.0050.0100.0200.030a0.010)101, a0.025 (2)成绩不低于 70 分的频率为 (0.0300.0250.010)100.65, 事件 A 发生的概率约为 0.65 (3)抽取的 100 名理科生中,成绩在60,70)内的有 1000.0201020 人, 成绩在70,80)内的有 100
30、0.0301030 人, 故采用分层抽样抽取的 10 名理科生中, 成绩在60,70)内的有 4 人,在70,80)内的有 6 人,由题可知,X 的可能取值为 0,1,2,3,4, P(X0) C46 C410 15 210 1 14, P(X1)C 3 6 C 1 4 C410 80 210 8 21, P(X2)C 2 6 C 2 4 C410 90 210 3 7, P(X3)C 1 6 C 3 4 C410 24 210 4 35, P(X4) C44 C410 1 210 X 的分布列为 X 0 1 2 3 4 P 1 14 8 21 3 7 4 35 1 210 E(X)0 1 141 8 212 3 73 4 354 1 210 8 5