1、高考专题突破六高考专题突破六高考中的概率与统计问题高考中的概率与统计问题 题型一 随机事件的概率 例 1 某社区举办“环保我参与”有奖问答比赛活动,某场比赛中,甲、乙、丙三个家庭同时 回答一道有关环保知识的问题已知甲家庭回答正确这道题的概率是3 4,甲、丙两个家庭都回 答错误的概率是 1 12,乙、丙两个家庭都回答正确的概率是 1 4.若各家庭回答是否正确互不影响 (1)求乙、丙两个家庭各自回答正确这道题的概率; (2)求甲、乙、丙三个家庭中不少于 2 个家庭回答正确这道题的概率 解(1)记“甲家庭回答正确这道题”“乙家庭回答正确这道题”“丙家庭回答正确这道 题”分别为事件 A,B,C,则 P
2、(A)3 4,且有 P A P C 1 12, PBPC1 4, 即 1PA1PC 1 12, PBPC1 4, 所以 P(B)3 8,P(C) 2 3. (2)有 0 个家庭回答正确的概率为 P0P( ABC )P( A )P( B )P( C )1 4 5 8 1 3 5 96, 有 1 个家庭回答正确的概率为 P1P(A BC A B C AB C)P(A BC )P( A B C )P( AB C) P(A)P( B )P( C )P( A )P(B)P( C )P( A )P( B )P(C) 3 4 5 8 1 3 1 4 3 8 1 3 1 4 5 8 2 3 7 24, 所以不
3、少于 2 个家庭回答正确这道题的概率为 P1P0P11 5 96 7 24 21 32. 思维升华 随机事件的概率求解策略 (1)对复杂的随机事件表示成互斥事件的和,独立事件的积; (2)利用概率的性质进行计算 跟踪训练 1 (1)(2020上海市七宝中学模拟)通过手机验证码登录哈啰单车 App,验证码由四位 数字随机组成,如某人收到的验证码(a1,a2,a3,a4)满足 a1a2a3a4,则称该验证码为递增 型验证码,某人收到一个验证码,那么是首位为 2 的递增型验证码的概率为_ 答案 1 6 解析a12,2a2a310.828, 故有 99.9%的把握认为村民的性别与参与管理的意愿具有相关
4、性 思维升华 统计案例的综合应用常涉及相互独立事件同时发生的概率、 独立重复实验、 超几何 分布、二项分布、独立性检验、线性回归等知识,考查学生的阅读理解能力、数据处理能力、 运算求解能力及应用意识 跟踪训练 4 (2020济宁模拟)下面给出了根据我国 2012 年2018 年水果人均占有量 y (单位: kg) 和年份代码 x 绘制的散点图和线性回归方程的残差图(2012 年2018 年的年份代码 x 分别为 17). (1)根据散点图分析 y 与 x 之间的相关关系; (2)根据散点图相应数据计算得错误错误!i1 074,错误错误!iyi4 517,求 y 关于 x 的线性回归方程; (3
5、)根据线性回归方程的残差图,分析线性回归方程的拟合效果(只写出结论) 附:线性回归方程y a b x 中斜率和截距的最小二乘估计公式分别为 b 错误错误!错误错误!,a y b x . 解(1)由散点图可以看出,点大致分布在某一直线的附近,且当 x 由小变大时,y 也由小变 大,从而 y 与 x 之间是正相关关系 (2)由题中数据可得 x 1 7(1234567)4, y 1 71 074 1 074 7 , 从而b 错误错误! 4 51771 074 7 4 12223242526272742 221 28 , a y b x 1 074 7 221 28 4853 7 , 从而所求 y 关
6、于 x 的线性回归方程为y 221 28 x853 7 . (3)由残差图可以看出,残差对应的点均匀地落在水平带状区域内,且宽度较窄,说明拟合效 果较好 课时精练课时精练 1(2020全国)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为 A,B,C, D 四个等级加工业务约定:对于 A 级品、B 级品、C 级品,厂家每件分别收取加工费 90 元, 50 元,20 元;对于 D 级品,厂家每件要赔偿原料损失费 50 元该厂有甲、乙两个分厂可承 接加工业务甲分厂加工成本费为 25 元/件,乙分厂加工成本费为 20 元/件厂家为决定由 哪个分厂承接加工业务, 在两个分厂各试加工了 10
7、0 件这种产品, 并统计了这些产品的等级, 整理如下: 甲分厂产品等级的频数分布表 等级ABCD 频数40202020 乙分厂产品等级的频数分布表 等级ABCD 频数28173421 (1)分别估计甲、乙两分厂加工出来的一件产品为 A 级品的概率; (2)分别求甲、乙两分厂加工出来的 100 件产品的平均利润,以平均利润为依据,厂家应选哪 个分厂承接加工业务? 解(1)由表可知,甲分厂加工出来的一件产品为 A 级品的概率的估计值为 40 1000.4,乙分厂 加工出来的一件产品为 A 级品的概率的估计值为 28 1000.28. (2)甲分厂加工 100 件产品的总利润为 40(9025)20
8、(5025)20(2025)20(5025)1 500(元), 所以甲分厂加工 100 件产品的平均利润为 15 元; 乙分厂加工 100 件产品的总利润为 28(9020)17(5020)34(2020)21(5020)1 000(元), 所以乙分厂加工 100 件产品的平均利润为 10 元 比较甲、乙两分厂加工的产品的平均利润,厂家应选择甲分厂承接加工业务 2从某企业生产的某种产品中抽取 100 件,测量这些产品的质量指标值,由测量结果得到如 图所示的频率分布直方图,质量指标值落在区间55,65),65,75),75,85内的频率之比为 421. (1)求这些产品的质量指标值落在区间75,
9、85内的频率; (2)若将频率视为概率,从该企业生产的这种产品中随机抽取 3 件,记这 3 件产品中质量指标 值位于45,75)内的产品件数为 X,求 X 的分布列与均值 解(1)设落在区间75,85内的频率为 x, 则落在区间55,65), 65,75)内的频率分别为 4x 和 2x, 依题意得(0.0040.0120.0190.030)104x2xx1, 解得 x0.05. 所以质量指标值落在区间75,85内的频率为 0.05. (2)从该企业生产的该种产品中随机抽取 3 件,相当于进行了 3 次独立重复试验,所以 X 服从 二项分布 XB(n,p),其中 n3. 由(1)得,落在区间45
10、,75)内的频率为 0.30.20.10.6,将频率视为概率得 p0.6. 因为 X 的所有可能取值为 0,1,2,3, 则 P(X0)C030.600.430.064,P(X1)C130.610.420.288, P(X2)C230.620.410.432,P(X3)C330.630.400.216, 所以 X 的分布列为 X0123 P0.0640.2880.4320.216 所以 X 的均值为 E(X)00.06410.28820.43230.2161.8. (或直接根据二项分布的均值公式得到 E(X)np30.61.8) 3(2019全国)某商场为提高服务质量,随机调查了 50 名男顾
11、客和 50 名女顾客,每位顾客 对该商场的服务给出满意或不满意的评价,得到下面列联表: 满意不满意 男顾客4010 女顾客3020 (1)分别估计男、女顾客对该商场服务满意的概率; (2)能否有 95%的把握认为男、女顾客对该商场服务的评价有差异? 附:K2 nadbc2 abcdacbd. P(K2k)0.0500.0100.001 k3.8416.63510.828 解(1)由调查数据,男顾客中对该商场服务满意的频率为40 500.8, 因此男顾客对该商场服务满意的概率的估计值为 0.8. 女顾客中对该商场服务满意的频率为30 500.6, 因此女顾客对该商场服务满意的概率的估计值为 0.
12、6. (2)K2的观测值 k10040203010 2 50507030 4.762. 由于 4.7623.841,故有 95%的把握认为男、女顾客对该商场服务的评价有差异 4(2021四川省成都市第七中学模拟)某厂生产不同规格的一种产品,根据检测标准,其合格 产品的质量 y(g)与尺寸 x(mm)之间近似满足关系式 ycxb(b,c 为大于 0 的常数)按照某指 标测定, 当产品质量与尺寸的比在区间(0.302,0.388)内时为优等品 现随机抽取 6 件合格产品, 测得数据如下: 尺寸 x(mm)384858687888 质量 y(g)16.818.820.722.42425.5 质量与尺
13、寸的比y x 0.4420.3920.3570.3290.3080.290 (1)现从抽取的 6 件合格产品中再任选 2 件,求选中的 2 件均为优等品的概率; (2)根据测得的数据作了初步处理,得相关统计量的值如下表: 错误错误!(ln xiln yi) 错误错误!(ln xi) 错误错误!(ln yi) 错误错误!(ln xi)2 75.324.618.3101.4 根据所给统计量,求 y 关于 x 的非线性回归方程 附:对于样本(vi,ui)(i1,2,6),其回归直线u b va 的斜率和截距的最小二乘估计公 式分别为: b 错误错误!错误错误!,a u b v . 解(1)由已知,优
14、等品的质量与尺寸的比y x(0.302,0.388), 则随机抽取的 6 件合格产品中,有 3 件为优等品,记为 a,b,c, 有 3 件为非优等品,记为 d,e,f, 现从抽取的 6 件合格产品中再任选 2 件,所有结果为(a,b),(a,c),(a,d),(a,e)(a,f), (b,c),(b,d),(b,e),(b,f),(c,d),(c,e),(c,f),(d,e),(d,f),(e,f), 选中的两件均为优等品的所有结果为(a,b),(a,c),(b,c), 所以所求概率为 3 15 1 5. (2)对 ycxb两边取自然对数得 ln yln cbln x, 令 viln xi,u
15、iln yi,则u b va ,且a ln c, 由所给统计量及最小二乘估计公式有 b 6 i1viui6 uv 6 i1v 2 i6 v2 75.324.618.36 101.424.626 0.27 0.54 1 2, a u b v 18.31 224.6 6 1, 由a ln c 得 ce, 所以 y 关于 x 的非线性回归方程为y ex0.5. 5(2021南阳模拟)2020 年初,新型冠状病毒肆虐,全民开启防疫防控冠状肺炎的感染主 要是人与人之间进行传播,可以通过飞沫以及粪便进行传染,冠状肺炎感染人群年龄大多数 是 40 岁以上的人群 该病毒进入人体后有潜伏期, 潜伏期是指病原体侵
16、入人体至最早出现临 床症状的这段时间 潜伏期越长, 感染到他人的可能性越高, 现对 200 个病例的潜伏期(单位: 天)进行调查,统计发现潜伏期中位数为 5,平均数为 7.1,方差为 5.06.如果认为超过 8 天的 潜伏期属于“长潜伏期”,按照年龄统计样本,得到下面的列联表: 长潜伏期非长潜伏期总计 40 岁以上30110140 40 岁及 40 岁以下204060 总计50150200 (1)是否有 95%的把握认为“长潜伏期”与年龄有关? (2)假设潜伏期 Z 服从正态分布 N(,2),其中近似为样本平均数 x ,2近似为样本方差 s2. 现在很多省份对入境旅客一律要求隔离 14 天,请
17、用概率的知识解释其合理性; (3)以题目中的样本频率估计概率,设 1 000 个病例中恰有 k(kN*)个属于“长潜伏期”的概 率是 g(k),当 k 为何值时,g(k)取得最大值? 附:K2 nadbc2 abcdacbd. P(K2k0)0.10.050.01 k02.7063.8416.635 若随机变量 Z 服从正态分布 N(,2),则 P(Z)0.682 7,P(2Z 2)0.954 5,P(3Z3)0.997 3, 5.062.25. 解(1)k200304011020 2 1406050150 3.17, 由于 3.173.841, 故没有 95%的把握认为“长潜伏期”与年龄有关
18、 (2)由题意知潜伏期 ZN(7.1,2.252), 由 P(Z13.85)10.997 3 2 0.001 35, 得知潜伏期超过 14 天的概率很低,因此隔离 14 天是合理的 (3)由于 200 个病例中有 50 个属于长潜伏期, 若以样本频率估计概率,一个患者属于“长潜伏期”的概率是1 4, 于是 g(k)Ck1 000 1 4 k 3 4 1 000k. 则 gk gk1 Ck1 000 1 4 k 3 4 1 000k Ck 1 1 000 1 4 k1 3 4 1 001k Ck1 000 3Ck 1 1 000 1 3 k1!1 001k! k!1 000k! 1 3 1 001 k 1 . 当 0k1; 当1 001 4 k1 000 且 kN*时, gk gk11; g(1)g(2)g(251)g(1 000) 故当 k250 时,g(k)取得最大值