1、概率、统计的综合题概率、统计的综合题 考试要求 能从研究对象中获取数据,会用数学方法对数据进行整理、分 析和推断,构建模型等 考点一 概率与统计的综合应用 概率与统计作为考查考生应用意识的重要载体,已成为近几年 高考的一大亮点和热点它与其他知识融合、渗透,情境新颖,充分体现了概率 与统计的工具性和交汇性统计以考查抽样方法、样本的频率分布、样本特征数 的计算为主,概率以考查概率计算为主,往往和实际问题相结合,要注意理解实 际问题的意义,使之和相应的概率计算对应起来,只有这样才能有效地解决问题 典例 1 从某技术公司开发的某种产品中随机抽取 200 件,测量这些产品的 一项质量指标值(记为 Z),
2、由测量结果得如下频率分布直方图: (1)公司规定:当 Z95 时,产品为正品;当 Z95 时,产品为次品公司每生 产一件这种产品,若是正品,则盈利 90 元;若是次品,则亏损 30 元记 为生产 一件这种产品的利润,求随机变量 的分布列和数学期望; (2)由频率分布直方图可以认为,Z 服从正态分布 N(,2),其中 近似为样本 平均数 x ,2近似为样本方差 s2(同一组中的数据用该区间的中点值作代表) 利用该正态分布,求 P(87.8Z112.2); 某客户从该公司购买了 500 件这种产品,记 X 表示这 500 件产品中该项质 量指标值位于区间(87.8,112.2)内的产品件数,利用的
3、结果,求 E(X) 附: 15012.2. 若 ZN(,2),则 P(Z)0.682 7,P(2Z2)0.954 5. 解 (1)由频率估计概率,产品为正品的概率为(0.0330.0240.008 0.002)100.67, 所以随机变量 的分布列为 90 30 P 0.67 0.33 所以 E()900.67(30)0.3350.4. (2)由频率分布直方图知,抽取产品的该项质量指标值的样本平均数 x 和样本 方差 s2分别为 x 700.02800.09900.221000.331100.241200.08 1300.02100, s2(30)20.02(20)20.09(10)20.22
4、020.331020.24 2020.083020.02150. 因为 ZN(100,150), 从而 P(87.8Z112.2)P(10012.2Z10012.2)0.682 7. 由知,一件产品中该项质量指标值位于区间(87.8,112.2)内的概率为 0.6827,依题意知 XB(500,0.682 7),所以 E(X)5000.682 7341.35. 点评:本题以统计图表为载体,将正态分布、二项分布、频率分布直方图巧 妙的融合在一起,体现了知识的整合性与交汇融合性,搞清这些统计图表的含义, 掌握好样本特征数的计数方法、各类概率的计算方法及均值与方差的运算是解决 问题的关键 跟进训练
5、经销商经销某种农产品,在一个销售季度内,每售出 1 t 该产品获得利润 500 元,未售出的产品,每 1 t 亏损 300 元根据以往资料,得到销售季度内市场需求 量的频率分布直方图,如图所示经销商为下一个销售季度购进了 130 t 该农产 品以 X(单位:t,100X150)表示下一个销售季度内的市场需求量,T(单位:元) 表示下一个销售季度内经销该农产品的利润 (1)将 T 表示为 X 的函数; (2)根据直方图估计利润 T 不少于 57 000 元的概率; (3)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,需求 量落入该区间的频率作为需求量取该区间中点值的概率(例如:若需
6、求量 X100,110),则取 X105,且 X105 的概率等于需求量落入100,110)的频率), 求 T 的均值 解 (1)当 X100,130)时, T500X300(130X)800X39 000. 当 X130,150时,T50013065 000. 所以 T 800X39 000,100X130, 65 000,130X150. (2)由(1)知利润 T 不少于 57 000 元当且仅当 120X150. 由直方图知需求量 X120,150的频率为 0.7,所以下一个销售季度内的利润 T 不少于 57 000 元的概率的估计值为 0.7. (3)依题意可得 T 的分布列为 T 4
7、5 000 53 000 61 000 65 000 P 0.1 0.2 0.3 0.4 所以 E(T)45 0000.153 0000.261 0000.365 0000.459 400. 考点二 概率与统计案例的综合应用 概率与统计案例的综合应用常涉及相互独立事件同时发生的概 率、频率分布直方图的识别与应用、数字特征、独立性检验等基础知识,考查学 生的阅读理解能力、数据处理能力、运算求解能力及应用意识 典例 2(2020 西安五校联考)为加快经济转型升级,加大技术研发力度,某市 建立高新科技研发园区,并力邀某高校入驻该园区为了解教职工意愿,该高校 在其所属的 8 个学院的教职工中作了“是否
8、愿意将学校整体搬迁至研发园区”的 问卷调查,8 个学院的调查人数及统计数据如下: 调查人数 x 10 20 30 40 50 60 70 80 愿意整体搬迁人数 y 8 17 25 31 39 47 55 66 (1)请根据上表提供的数据,用最小二乘法求出变量 y 关于变量 x 的线性回归 方程y bxa(b保留小数点后两位有效数字);若该校共有教职工 2 500 人,请预测 该校愿意将学校整体搬迁至研发园区的人数 (2)若该校的 8 位院长中有 5 位院长愿意将学校整体搬迁至研发园区,现该校 拟在这 8 位院长中随机选取 4 位院长组成考察团赴研发园区进行实地考察,记 X 为考察团中愿意将学
9、校整体搬迁至研发园区的院长人数,求 X 的分布列及数学期 望 参考公式及数据:b n i1xiyinx y n i1x 2 inx 2 ,a y bx , 8 i1xiyi16 310, 8 i1x 2 i20 400. 解 (1)由已知得 x 45, y 36,b 8 i1xiyi8 x y 8 i1x 2 i8 x 2 16 31084536 20 4008452 0.80,a 360.80450, 故变量 y 关于变量 x 的线性回归方程为y 0.80 x. 所以当 x2 500 时, y2 5000.802 000, 所以该校愿意将学校整体搬迁至 研发园区的人数约为 2 000. (2
10、)由题意可知 X 的可能取值为 1,2,3,4. P(X1)C 1 5 C33 C48 1 14,P(X2) C25 C23 C48 3 7, P(X3)C 3 5 C13 C48 3 7,P(X4) C45 C48 1 14. 所以 X 的分布列为 X 1 2 3 4 P 1 14 3 7 3 7 1 14 故 E(X)1 1 142 3 73 3 74 1 14 5 2. 点评:在两个变量的回归分析中要注意以下两点 (1)求回归直线方程要充分利用已知数据,合理利用公式减少运算 (2)借助散点图,观察两个变量之间的关系若不是线性关系,则需要根据相 关知识转化为线性关系 跟进训练 某健身馆在
11、2020 年 7,8 两个月推出优惠项目吸引了一批客户 为预估 2021 年 7,8 两个月客户投入的健身消费金额,健身馆随机抽样统计了 2020 年 7,8 两个月 100 名客户的消费金额(单位:元),分组如下:0,200),200,400),400,600), 1 000,1 200,得到如图所示的频率分布直方图: (1)请用抽样的数据预估2021年7,8两个月健身客户人均消费的金额(同一组中 的数据用该组区间的中点值作代表) (2)若把 2020 年 7,8 两个月健身消费金额不低于 800 元的客户称为“健身达 人”经数据处理,现在列联表中得到一定的相关数据,请补全空格处的数据, 并
12、根据列联表判断是否有 95%的把握认为“健身达人”与性别有关? 健身达人 非健身达人 总计 男 10 女 30 总计 (3)为吸引顾客,在健身项目之外,该健身馆特推出健身配套营养品的销售, 现有两种促销方案 方案一:每满 800 元可立减 100 元; 方案二:金额超过 800 元可抽奖三次,每次中奖的概率为1 2,且每次抽奖互不 影响,中奖 1 次打 9 折, 中奖 2 次打 8 折,中奖 3 次打 7 折 若某人打算购买 1 000 元的营养品, 请从实际付款金额的数学期望的角度分析 应该选择哪种促销方案 附: P(K2k) 0.150 0.100 0.050 0.010 0.005 k
13、2.072 2.706 3.841 6.635 7.879 K2 nadbc2 abcdacbd. 解 (1)因为2020年7,8两个月这100名客户消费金额的平均值为(1000.000 50 3000.000 75 5000.001 00 7000.001 25 9000.001 00 1 1000.000 50)200620(元), 所以预估 2021 年 7,8 两个月健身客户人均消费金额为 620 元 (2)列联表如下: 健身达人 非健身达人 总计 男 10 40 50 女 20 30 50 总计 30 70 100 因为 K210010302040 2 50503070 4.7623
14、.841,所以有 95%的把握认为 “健身达人”与性别有关 (3)若选择方案一,则需付款 900 元; 若选择方案二,设需付款 X 元,则 X 的可能取值为 700,800,900,1 000, P(X700)C 3 3 1 2 3 1 8, P(X800)C 2 3 1 2 3 3 8, P(X900)C 1 3 1 2 3 3 8, P(X1 000)C 0 3 1 2 3 1 8, 所以 E(X)7001 8800 3 8900 3 81 000 1 8850(元) 因为 850900,所以选择方案二更划算 考点三 概率、统计与函数、数列的交汇问题 由于随机变量 对应的概率 P0,1,
15、故常先借助概率统计的知 识建立有关 P 的函数解析式或递推关系式,在此基础上借助函数或导数、数列等 知识求解相应问题 典例 3 某商场以分期付款方式销售某商品,根据以往资料统计,顾客购买 该商品选择分期付款的期数 的分布列为 2 3 4 P 0.4 a b 其中 0a1,0b1. (1)求购买该商品的 3 位顾客中,恰有 2 位选择分 2 期付款的概率; (2)商场销售一件该商品,若顾客选择分 2 期付款,则商场获得的利润为 200 元;若顾客选择分 3 期付款,则商场获得的利润为 250 元;若顾客选择分 4 期付 款,则商场获得的利润为 300 元商场销售两件该商品所获得的利润记为 X(单
16、位: 元) 求 X 的分布列; 若 P(X500)0.8,求 X 的数学期望 E(X)的最大值 解 (1)设购买该商品的 3 位顾客中,选择分 2 期付款的人数为 ,依题意得 B(3,0.4), 则 P(2)C 2 3(0.4)2(10.4)0.288, 购买该商品的 3 位顾客中,恰有 2 位选择分 2 期付款的概率为 0.288. (2)依题意 X 的取值分别为 400,450,500,550,600, P(X400)0.40.40.16, P(X450)20.4a0.8a, P(X500)20.4ba20.8ba2, P(X550)2ab, P(X600)b2. X 的分布列为: X 4
17、00 450 500 550 600 P 0.16 0.8a 0.8ba2 2ab b2 P(X500)P(X400)P(X450)P(X500) 0.160.8(ab)a2, 根据 0.4ab1,得 ab0.6,b0.6a, P(X500)0.8,0.160.48a20.8, 解得 a0.4 或 a0.4, a0,a0.4,b0,0.6a0,解得 a0.6, a0.4,0.6), E(X)4000.164500.8a500(0.8ba2)1 100ab600b2520 100a, 当 a0.4 时,E(X)的最大值为 480, X 的数学期望 E(X)的最大值为 480. 点评:本例融概率、
18、分布列、函数于一体,体现了高考命题的最新动向,求 解时可先借助分布列的性质及题设条件“P(X500)0.8”探求得到参数 a 的范 围,然后借助数学期望公式建立关于参数 a 的函数关系式,并通过二次函数求得 数学期望 E(X)的最大值 跟进训练 某市有一家大型共享汽车公司,在市场上分别投放了黄、蓝两种颜色的汽车, 已知黄、蓝两种颜色的汽车的投放比例为 31.监管部门为了了解这两种颜色汽车 的质量,决定从投放到市场上的汽车中随机抽取 5 辆汽车进行试驾体验,假设每 辆汽车被抽取的可能性相同 (1)求抽取的 5 辆汽车中恰有 2 辆是蓝色汽车的概率; (2)在试驾体验过程中,发现蓝色汽车存在一定质
19、量问题,监管部门决定从投 放的汽车中随机地抽取一辆送技术部门作进一步抽样检测,并规定:若抽到的是 黄色汽车,则将其放回市场,并继续随机地抽取下一辆汽车;若抽到的是蓝色汽 车,则抽样结束抽样的次数不超过 n(nN*)次在抽样结束时,若已抽到的黄 色汽车数以 表示,求 的分布列和数学期望 解 (1)随机地抽取一辆汽车是蓝色汽车的概率为1 4, 用 X 表示“抽取的 5 辆汽车中蓝色汽车的辆数”, 则 X 服从二项分布, 即 X B 5,1 4 , 所以抽取的 5 辆汽车中恰有 2 辆是蓝色汽车的概率 PC 2 5 3 4 3 1 4 2 135 512. (2) 的可能取值为 0,1,2,n. P
20、(0)1 4,P(1) 3 4 1 4 3 16,P(2) 3 4 2 1 4, P(n1) 3 4 n1 1 4,P(n) 3 4 n . 所以 的分布列为 0 1 2 n1 n P 1 4 3 4 1 4 3 4 2 1 4 3 4 n1 1 4 3 4 n 的数学期望 E()13 4 1 42 3 4 2 1 43 3 4 3 1 4(n1) 3 4 n1 1 4n 3 4 n , 3 4E()1 3 4 21 42 3 4 3 1 4(n2) 3 4 n1 1 4(n1) 3 4 n 1 4 n 3 4 n1 . 得 1 4 E() 3 4 1 4 3 4 2 1 4 3 4 3 1
21、4 3 4 n1 1 4 n 3 4 n n1 3 4 n 1 4n 3 4 n1 3 4 1 4 3 4 2 1 4 3 4 31 4 3 4 n1 1 4 3 4 n 1 4, 所以 E()3 4 3 4 2 3 4 3 3 4 n1 3 4 n 3 4 1 3 4 n 13 4 3 1 3 4 n 3 3 3 4 n . 核心素养 6 用数学语言表达世界数据分析与建模求解 数据分析是指针对研究对象获得相关数据,运用统计方法对数据中的有用信 息进行分析和推断,形成知识的过程主要包括:收集数据,整理数据,提取信 息,构建模型对信息进行分析、推断,获得结论在数据分析核心素养的形成过 程中,学生
22、能够提升数据处理的能力,增强基于数据表达现实问题的意识,养成 通过数据思考问题的习惯,积极依托数据探索事物本质、关联和规律的活动经验. 素养案例 某学校为了了解全校学生的体重情况, 从全校学生中随机抽取了 100 人的体重数据,结果这 100 人的体重全部介于 45 公斤到 75 公斤之间,现将结 果按如下方式分为 6 组:第一组45,50),第二组50,55),第六组70,75),得 到如图所示的频率分布直方图,并发现这 100 人中,其体重低于 55 公斤的有 15 人,这 15 人体重数据的茎叶图如图所示,以样本的频率作为总体的概率 图 图 (1)求频率分布直方图中 a,b,c 的值;
23、(2)从全校学生中随机抽取 3 名学生,记 X 为体重在55,65)的人数,求 X 的概 率分布列和数学期望; (3)由频率分布直方图可以认为, 该校学生的体重 近似服从正态分布 N(, 2), 其中 60,225.若 P(22)0.954 5,则认为该校学生的体重是正 常的试判断该校学生的体重是否正常?并说明理由 解 (1)由题图知,100 名样本中体重低于 50 公斤的有 2 人, 用样本的频率估计总体的概率,可得体重低于 50 公斤的概率为 2 1000.02,则 a0.02 5 0.004, 在50,55)上有 13 人,该组的频率为 0.13,则 b0.13 5 0.026, 所以
24、2c120.0220.13 5 0.14,即 c0.07. (2)用样本的频率估计总体的概率,可知从全体学生中随机抽取一人,体重在 55,65)的概率为 0.07100.7,随机抽取 3 人,相当于三次独立重复试验,随机 变量 X 服从二项分布 B(3,0.7), 则 P(X0)C 0 30.700.330.027, P(X1)C 1 30.710.320.189, P(X2)C 2 30.720.310.441, P(X3)C 3 30.730.300.343, 所以,X 的概率分布列为: X 0 1 2 3 P 0.027 0.189 0.441 0.343 E(X)30.72.1. (3
25、)由 N(60,25)得 5, 由图知 P(22)P(5070)0.960.954 5.所以可以认为 该校学生的体重是正常的 评析 本题以学生体重情况为背景,设计概率与统计、正态分布的综合应 用体现了数学建模(用频率估计概率、正态分布)、数学运算(求平均数、方差、 求概率)、数据分析、逻辑推理(以直方图中求平均数方差,由正态分布求概率及期 望)的学科素养,培养了统计意识,经历“收集数据整理数据分析数据作出 推断”的全过程 素养培优 某基地蔬菜大棚采用无土栽培的方式种植各类蔬菜根据过去 50 周的资料显 示,该地周光照量 X(小时)都在 30 小时以上,其中不足 50 小时的有 5 周,不低于
26、50 小时且不超过 70 小时的有 35 周,超过 70 小时的有 10 周根据统计,该基地 的西红柿增加量 y(千克)与使用某种液体肥料的质量 x(千克)之间的关系为如图所 示的折线图 (1)依据折线图, 是否可用线性回归模型拟合 y 与 x 的关系?请计算相关系数 r 并加以说明(精确到 0.01)(若|r|0.75,则线性相关程度很高,可用线性回归模型 拟合) (2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控 制仪,但每周光照控制仪运行台数受周光照量 X 限制,并有如下关系: 周光照量 X (单位:小时) 30X50 50X70 X70 光照控制仪最多可运行台数 3
27、 2 1 若某台光照控制仪运行,则该台光照控制仪周利润为 3 000 元;若某台光照控 制仪未运行,则该台光照控制仪周亏损 1 000 元以频率作为概率,商家欲使周总 利润的均值达到最大,应安装光照控制仪多少台? 附:相关系数公式 r n i1 xi x yi y n i1 xi x 2 n i1 yi y 2, 参考数据: 0.30.55, 0.90.95. 解 (1)由已知数据可得 x 24568 5 5, y 34445 5 4. 因为 5 i1 (xi x )(yi y )(3)(1)000316, 5 i1 xi x 2 32120212322 5, 5 i1 yi y 2 1202
28、020212 2. 所以相关系数 r 5 i1 xi x yi y 5 i1 xi x 2 5 i1 yi y 2 6 2 5 2 9 100.95. 因为 r0.75,所以可用线性回归模型拟合 y 与 x 的关系 (2)记商家周总利润为 Y 元,由条件可知至少需安装 1 台,最多安装 3 台光照 控制仪 安装 1 台光照控制仪可获得周总利润 3 000 元 安装 2 台光照控制仪的情形: 当 X70 时,只有 1 台光照控制仪运行,此时周总利润 Y3 0001 0002 000(元), P(Y2 000)10 500.2, 当 30X70 时,2 台光照控制仪都运行,此时周总利润 Y23 0
29、006 000(元), P(X6 000)40 500.8, 故 Y 的分布列为 Y 2 000 6 000 P 0.2 0.8 所以 E(Y)2 0000.26 0000.85 200(元) 安装 3 台光照控制仪的情形: 当 X70 时,只有 1 台光照控制仪运行,此时周总利润 Y13 00021 0001 000(元), P(Y1 000)10 500.2, 当 50X70 时,有 2 台光照控制仪运行,此时周总利润 Y23 00011 0005 000(元), P(Y5 000)35 500.7, 当 30X50 时,3 台光照控制仪都运行,周总利润 Y33 0009 000(元), P(Y9 000) 5 500.1, 故 Y 的分布列为 Y 1 000 5 000 9 000 P 0.2 0.7 0.1 所以 E(Y)1 0000.25 0000.79 0000.14 600(元) 综上可知,为使商家周总利润的均值达到最大,应该安装 2 台光照控制仪