1、二轮大题专练二轮大题专练 50随机变量的分布列(独立性检验)随机变量的分布列(独立性检验) 1近年来,我国肥胖人群的规模急速增长,肥胖人群有着很大的健康隐患目前,国际上 常用身体质量指数(英文为 BodyMassIndex,简称 BMI)来衡量人体胖瘦程度以及是否健 康, 其计算公式是 BMI, 中国成人的 BMI 数值标准为: BMI18.5 为偏瘦;18.5BMI23.9 为正常;24BMI27.9 为偏胖;BMI28 为肥胖某地区随 机调查了 100 名 35 岁以上成人的身体健康状况,测量身高、体重并计算 BMI 数值 (1)根据调查结果制作下面的 22 列联表,并判断能否有 99%的
2、把握认为 35 岁以上成 人肥胖与不经常运动有关? 肥胖 不肥胖 总计 经常运动员工 40 60 不经常运动员工 24 40 总计 100 参考公式:,其中 na+b+c+d 参考数据: P(K2k) 0.25 0.10 0.050 0.010 0.005 0.001 k 1.323 2.706 3.841 6.635 7.879 10.828 (2)如果视样本的频率视为概率,现随机地从这个地区抽取经常运动人群中的 3 人,不 经常运动人群中的 1 人座谈,记这 4 人中肥胖人数为 X,求 X 的分布列和数学期望 解: (1)填表如下: 肥胖 不肥胖 总计 经常运动员工 20 40 60 不经
3、常运动员工 24 16 40 总计 44 56 100 所以 K26.926, 因为 6.9266.635,所以有 99%的把握认为肥胖与不经常运动有关 (2) “经常运动且肥胖”的概率为, “经常运动且不肥胖”的概率为, “不经常运动且肥胖”的概率为, “不经常运动且不肥胖”的概率为, X 的所有可能取值为 0,1,2,3,4, P(X0)()3, P(X1)()2+()3, P(X2)()2+()2, P(X3)()3+()2, P(X4)()3, 所以随机变量 X 的分布列为 X 0 1 2 3 4 P 则数学期望为 E(X)0+1+2+3+4 2随着人们生活水平的提高和对健康生活的重视
4、,越来越多的人加入到了健身运动中某 健身房从参与健身的会员中随机抽取了 100 人, 对其每周参与健身的天数和 2020 年在该 健身房的消费金额(单位:元)进行统计,得到以下统计表和统计图: 平均每周健身天数 不大于 2 3 或 4 不小于 5 男性会员人数 20 35 10 女性会员人数 10 20 5 若某人平均每周健身天数不小于 5,则称其为“健身达人” 该健身房规定年消费金额不 超过 1600 元的为普通会员,超过 1600 元但不超过 3200 元的为银牌会员,超过 3200 元 的为金牌会员 (1)已知金牌会员都是“健身达人” ,现从这 100 位会员里的“健身达人”中随机抽取
5、2 人,求他们都是金牌会员的概率; (2)根据所给数据,完成下面的 22 列联表: 男性会员 女性会员 是“健身达人” 不是“健身达人” 并判断能否在犯错误的概率不超过 0.05 的前提下认为是否为“健身达人”和性别有关? (3)该健身机构在 2020 年年底针对这 100 位会员举办一次消费返利活动,每位会员均 可参与摸奖游戏,游戏规则如下:摸奖箱中装有 5 张形状大小完全一样的卡片,其中 3 张印跑步机图案、2 张印动感单车图案,有放回地摸三次卡片,每次只能摸一张若摸到 动感单车的总次数为 1,则获得 50 元奖励;若摸到动感单车的总次数为 2,则获得 100 元奖励;若摸到动感单车的总次
6、数为 3,则获得 200 元奖励,其他情况不予奖励规定每 个普通会员只能参加 1 次摸奖游戏,每个银牌会员可参加 2 次摸奖游戏,每个金牌会员 可参加 3 次摸奖游戏(每次摸奖结果相互独立) 试估计在此次消费返利活动中该健身机 构的总支出 附:,其中 na+b+c+d P(K2k0) 0.500 0.250 0.100 0.050 0.010 0.005 k0 0.455 1.323 2.706 3.841 6.636 7.879 解: (1)设事件 A 表示从这 100 位会员里的“健身达人”中随机抽取 2 人都是金牌会员, 则 (2)根据题意: 男性会员 女性会员 是“健身达人” 10 5
7、 不是“健身达人” 55 30 , 故不能在犯错误的概率不超过 0.05 的前提下认为是否为“健身达人”和性别有关系 (3)设一次摸奖所获得的奖励额为 X,则 X 的所有可能取值为 0,50,100,200, 且, , 故一次摸奖获得的奖励额的期望值为 , 故总支出约为(28+602+123)63.218463.211628.8 元 3为了解成年人的交通安全意识情况,某中学组织学生进行了一次全市成年人安全知识抽 样调查随机地抽取了 200 名成年人,然后对这 200 人进行问卷调查,其中拥有驾驶证的占 2 5 这 200 人所得的分数都分布在30,100范围内,规定分数在 80 以上(含80)
8、的为“具 有很强安全意识” ,所得分数的频率分布直方图如图 (1)补全下面的22列联表,并判断能否有95%的把握认为“具有很强安全意识”与“拥 有驾驶证”有关? 拥有驾驶证 没有驾驶证 总计 具有很强安全意识 22 不具有很强安全意识 总计 200 (2)将上述调查所得的频率视为概率,现从全市成年人中随机抽取 3 人,记“具有很强安 全意识”的人数为X,求X的分布列及数学期望 附临界值表: 2 2 () ()()()() n adbc K ab cd ac bd ,其中nabcd 2 0 ()P K 卥 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0 k 2.
9、072 2.706 3.841 5.024 6.635 7.879 10.828 解: (1)200 人中拥有驾驶证的占 2 5 ,有 80 人,没有驾驶证的有 120 人, 由题意知(0.0040.0080.0200.0280.0200.004) 101a, 解得0.016a 所以具有很强安全意识的人有200 (0.0160.004) 1040人, 不具有很强安全意识的有 160 人 补全22列联表如下: 拥有驾驶证 没有驾驶证 总计 具有很强安全意识 22 18 40 不具有很强安全意识 58 102 160 总计 80 120 200 计算得 2 2 200 (22 102 18 58)
10、75 4.6883.841 40 80 160 12016 K , 有95%的把握认为“具有很强安全意识”与“拥有驾驶证”有关 (2)由频率分布直方图中数据可知, 抽到的每个成年人“具有很强安全意识”的概率为 1 5 , 所以X的所有可能取值为 0,1,2,3 则 3 464 (0)( ) 5125 P X , 12 3 1448 (1)( ) 55125 P XC, 22 3 1412 (2)( ) 55125 P XC, 3 11 (3)( ) 5125 P X 所以X的分布列为: X 0 1 2 3 P 64 125 48 125 12 125 1 125 故 64481213 ()01
11、23 1251251251255 E X 4为了解使用手机是否对学生的学习有影响,某校随机抽取 50 名学生,对学习成绩和使用 手机情况进行了调查,统计数据如表所示(不完整): 使用手机 不使用手机 总计 学习成绩优秀 5 20 学习成绩一般 总计 30 50 (1)补充完整所给表格,并根据表格数据计算是否有99.9%的把握认为学生的学习成绩与 使用手机有关; (2) 现从如表 不使用手机的学生中按学习成绩是否优秀分层抽样选出 9 人, 再从这 9 人中 随机抽取 3 人,记这 3 人中“学习成绩优秀”的人数为X,试求X的分布列与数学期望 参考公式: 2 2 () ()()()() n adb
12、c K ab cd ac bd ,其中nabcd 参考数据: 2 0 ()P K 卥 0.050 0.010 0.001 0 k 3.841 6.635 10.828 解: (1)完成列联表如下: 使用手机 不使用手机 总计 学习成绩优秀 5 20 25 学习成绩一般 15 10 25 总计 20 30 50 22 2 ()50(5 1020 15) 0.053310.828 ()()()()20302525 n adbc K ab cd ac bd , 没有99.9%的把握认为学生的学习成绩与使用手机有关; (2)现从如表不使用手机的学生中按学习成绩是否优秀分层抽样选出 9 人, 则从学习成
13、绩优秀中抽取 20 96 30 人,从学习成绩一般中抽取 10 93 30 人, 再从这 9 人中随机抽取 3 人,记这 3 人中“学习成绩优秀”的人数为X, 则X的可能取值为 0,1,2,3, 3 3 3 9 1 (0) 84 C P X C , 12 63 3 9 18 (1) 84 C C P X C , 21 63 3 9 45 (2) 84 C C P X C , 3 6 3 9 20 (3) 84 C P X C , X的分布列为: X 0 1 2 3 P 1 84 18 84 45 84 20 84 数学期望 1184520 ()01232 84848484 E X 5教育部官方
14、数据显示,2020 届大学毕业生达到 844 万,根据相关调查,位于大城市的应 届毕业生毕业后,有30%会留在该城市进行就业,于是租房便成为这些毕业生的首选为 了了解应届毕业生房租支出的费用, 研究人员对部分毕业生进行相关调查, 所得数据如图所 示 (1)求m的值以及房租支出的平均值x; (2)为了了解应届生选择租房时考虑的主要因素,研究人员作出调查,所得数据如表所示, 判断是否有99.9%的把握认为性别与选择租房时考虑的主要因素具有相关性 以距离上班地点的远近作为主要考虑因 素 以房租的高低作为主要考虑因素 男生 500 300 女生 300 400 (3)由频率分布直方图,可近似地认为A城
15、市应届毕业生房租支出服从正态分布(N, 2 3.2 ),若 2020 年该市区的应急毕业生共有 100 万人,试根据本题信息估计毕业后留在该市 且房租支出介于 8.6 百元到 21.4 百元之间的毕业生人数 附:参考公式: 2 2 () ()()()() adbc K ab cd ac bd 参考数据: 2 ()P K 卥 0.100 0.050 0.010 0.001 k 2.706 3.841 6.635 10.828 ()0.6827PX,(22 )0.9544PX, (33 )0.9973PX 解: (1)依题意,(0.01250.050.03750.0125)41m,解得0.1375
16、m ; 故(0.0125 40.05 80.1375 120.0375 160.0125 20)411.8x ; (2)在本次实验中, 2 K的观测值 2 0 1500 (500 400300 300) 57.87610.828 800 800 700 700 k, 故有99.9%的把握认为性别与选择租房时考虑的主要因素具有相关性; (3)依题意,毕业后留在该市的应届毕业生人数为10000000.3300000人, 0.68270.9973 (8602140)(3 )0.84 2 PxPx , 故所求人数为3000000.84252000 6智慧课堂是指一种打破传统教育课堂模式,以信息化科学技
17、术为媒介实现师生之间、生 生之间的多维度互动,能有效提升教师教学效果、学生学习成果的新型教学模式为了进一 步推动智慧课堂的普及和应用,A市现对全市中小学智慧课堂的应用情况进行抽样调查, 统计数据如表: 经常应用 偶尔应用或者不应用 总计 农村 40 城市 60 总计 100 60 160 从城市学校中任选一个学校,偶尔应用或者不应用智慧课堂的概率是 1 4 (1)补全22列联表,判断能否有99.5%的把握认为智慧课堂的应用与区域有关,并说明 理由; (2)在偶尔应用或者不应用智慧课堂的学校中,按照农村和城市的比例抽取 6 个学校进行 分析, 然后再从这 6 个学校中随机抽取 2 个学校所在的地
18、域进行核实, 记其中农村学校有X 个,求X的分布列和数学期望 附: 2 2 () ()()()() n adbc K ab cd ac bd ,nabcd 2 0 ()P K 卥 0.1 0.050 0.010 0.005 0.001 0 k 2.706 3.841 6.635 7.879 10.828 解: (1)22列联表, 经常应用 偶尔应用或者不应用 总计 农村 40 40 80 城市 60 20 80 总计 100 60 160 (2 分) 22 2 ()160(20404060)32 10.6677.879 ()()()()10060 80 803 n adbc K ab cd a
19、c bd (4 分) 所以有99.5%的把握认为认为智慧课堂的应用与区域有关 (6 分) (2)在偶尔应用或者不应用智慧课堂的学校中,农村和城市的比例是2:1,所以抽取的 6 个样本有 4 个是农村学校,2 个是城市学校, 从中抽取 2 个,则X的可能取值为 0,1,2 (7 分) 02 42 2 6 1 (0) 15 C C P X C , 11 42 2 6 8 (1) 15 C C P X C , 2 4 2 6 0 2 2 (2) 5 C C P X C 所以X的分布列为: X 0 1 2 P 1 15 8 15 2 5 (10 分) X的数学期望 1824 ()012 151553
20、E X (12 分) 7某学校共有 1000 名学生,其中男生 400 人,为了解该校学生在学校的月消费情况,采取 分层抽样随机抽取了 100 名学生进行调查,月消费金额分布在 450950 之间根据调查 的结果绘制的学生在校月消费金额的频率分布直方图如图所示: 将月消费金额不低于 750 元的学生称为“高消费群” ()求 a 的值,并估计该校学生月消费金额的平均数(同一组中的数据用该组区间的 中点值作代表) ; ()现采用分层抽样的方式从月消费金额落在550,650) ,750,850)内的两组学生 中抽取 10 人,再从这 10 人中随机抽取 3 人,记被抽取的 3 名学生中属于“高消费群
21、” 的学生人数为随机变量 X,求 X 的分布列及数学期望; ()若样本中属于“高消费群”的女生有 10 人,完成下列 22 列联表,并判断是否 有 97.5%的把握认为该校学生属于“高消费群”与“性别”有关? 属于“高消费群” 不属于“高消费群” 合计 男 女 合计 (参考公式:,其中 na+b+c+d) P(K2k) 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 2.072 2.706 3.841 5.024 6.635 7.879 10.828 解: ()由题意知 100(0.0015+a+0.0025+0.0015+0.001)1,解得 a0.0035
22、, 样本平均数为 5000.15+6000.35+7000.25+8000.15+9000.10670 元 ()由题意,从550,650)中抽取 7 人,从750,850)中抽取 3 人, 随机变量 X 的所有可能取值有 0,1,2,3 P(Xk)(k0,1,2,3)所以随机变量 X 的分布列为: X 0 1 2 3 P 随机变量 X 的数学期望 E(X)+2+3 ()由题可知,样本中男生 40 人,女生 60 人属于“高消费群”的 25 人,其中女生 10 人;得出以下 22 列联表: 属于“高消费群” 不属于“高消费群” 合计 男生 15 25 40 女生 10 50 60 合计 25 75 100 5.024, 所以有 97.5%的把握认为概型学生属于“高消费群”与性别有关