1、暑假作业 14成对数据统计分析 A 卷 一、单选题(共 32 分) 1.某家具厂的原材料费支出 (单位:万元)与销售额 (单位:万元)之间有如下数据,根据表中提供的全部 数据,用最小二乘法得出 与 的线性回归方程为,则 为( ) = 8.5 + 24568 2535605575 A.B.C.D. 7.51012.517.5 2.假设有两个变量 与 的列联表如下表: 2 2 12 1 2 对于以下数据,对同一样本能说明 与 有关系的可能性最大的一组为( ) A.,B., = 2 = 3 = 4 = 5 = 5 = 3 = 3 = 4 C.,D., = 3 = 6 = 2 = 5 = 5 = 3
2、= 4 = 3 3.已知两个变量 和 之间有线性相关关系,经调查得到如下样本数据, 34567 3.52.41.1-0.2-1.3 根据表格中的数据求得同归方程,则下列说法正确的是( ) = + A.,B., 0 0 0 0 C.,D., 0 0 0 4.某学校食堂对 30 名高三学生偏爱蔬菜与偏爱肉类进行了一次调查,将统计数据制成如下表格: 偏爱蔬菜偏爱肉类 男生人48 女生人162 则认为偏爱蔬菜与偏爱肉类与性别有关的把握至少有( ) 附: 2= ()2 ( + )( + )( + )( + ), = + + + (2 0)0.0100.0050.001 0 6.6357.87910.82
3、8 A.95%B.99%C.99.5%D.99.9% 二、多选题(共 16 分) 5.有关独立性检验的四个命题,其中正确的是( ) A.两个变量的 22 列联表中,对角线上数据的乘积相差越大,说明两个变量有关系成立的可能性就越大 B.对分类变量 X 与 Y 的随机变量的观测值 k 来说,k 越小, “X 与 Y 有关系”的可信程度越小 2 C.从独立性检验可知:有 95%的把握认为秃顶与患心脏病有关,我们说某人秃顶,那么他有 95%的可能患有心脏病 D.从独立性检验可知:有 99%的把握认为吸烟与患肺癌有关,是指在犯错误的概率不超过 1%的前提下认为吸烟与患肺癌有关 6.下列说法: 对于独立性
4、检验,的值越大,说明两事件相关程度越大; 2 以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则 , 的值分别是 = = = 0.3 + 4 和 0.3; 4 已知随机变量,若,则 ()的值为; (0,2)(| 2 1 2 通过回归直线及回归系数 ,可以精确反映变量的取值和变化趋势 = + 其中错误的选项是( ) A.B.C.D. 三、填空题(共 16 分) 7.某校为了研究学生的性别与对待某一活动的态度(支持和不支持两种态度)的关系,运用列联表进行独立性检验,经计算 2 2 ,则所得到的统计学结论是:有_的把握认为“学生性别与是否支持该活动有关系”. 2= 6.669%
5、 附: (2 0)0.1000.0500.0250.0100.001 0 2.7063.8415.0246.63510.828 8.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了 8 次试验,收集数据如下: 零件个数 1020304050607080 加工时间 626875818995102108 设回归直线方程为,若,则点在直线的_方 = + = 2 3(,)4520 = 0 四、解答题(共 24 分) 9.从中国教育在线官方公布的考研动机调查来看,本科生扎堆考研的原因大概集中在这 6 个方面:本科就业压力大,提升竞争力; 通过考研选择真正感兴趣的专业;为了获得学历;继续
6、深造;随大流;有名校情结.如图是 20152019 年全国硕士研究生报考人 数趋势图(单位:万人)的折线图. (1)求 关于 的线性回归方程; (2)根据(1)中的回归方程,预测 2021 年全国硕士研究生报考人数. 参考数据:. 5 = 1()() = 311 回归方程中斜率和截距的最小二乘估计公式分别:,. = + = = 1()() = 1() 2 = 10.某学校为了了解该校高三年级学生寒假在家自主学习的情况,随机对该校 300 名高三学生寒假的每天学习时间(单位:h)进 行统计,按照,的分组作出频率分布直方图如图所示 0,2(2,4(4,6(6,8(8,10 ()根据频率分布直方图计
7、算该校高三年级学生的平均每天学习时间(同一组中的数据用该组区间中点值代表) ; ()该校规定学习时间超过 4h 为合格,否则不合格已知这 300 名学生中男生有 140 人,其中合格的有 70 人,请补全下表, 根据表中数据,能否有 99.9%的把握认为该校高三年级学生的性别与学习时长合格有关? 男生女生总计 不合格 合格70 总计140160300 参考公式:,其中 2= ()2 ( + )( + )( + )( + ) = + + + 参考附表: (2 0)0.0500.0100.001 0 3.8416.63510.828 11.某班级数学兴趣小组为了研究人脚的大小与身高的关系,随机抽测
8、了 20 位同学,得到如下数据: 序号12345678910 身高 (厘米) 192164172177176159171166182166 脚长 (码) 48384043443740394639 序号11121314151617181920 身高 (厘米) 169178167174168179165170162170 脚长 (码) 43414043404438423941 (1)若“身高大于 175 厘米”为“高个” , “身高小于等于 175 厘米”的为“非高个” ;“脚长大于 42 码”为“大码” , “脚长小 于等于 42 码”的为“非大码”.请根据上表数据完成列联表,求出的值(结果精确
9、到小数点后三位有效数字),并说明有 2 22 多大的可靠性认为“脚的大小与身高之间有关系” ; (2)请根据“序号为 5 的倍数”的几组数据,求出 关于 的线性回归方程. = + 附表及公式: (2 )0.150.100.050.0250.0100.0050.001 2.0722.7063.8415.0246.6357.87910.828 ; 2= ()2 ( + )( + )( + )( + ) = = 1()() = 1() 2 = 暑假作业 14成对数据统计分析 A 卷 一、单选题(共 20 分) 1.某家具厂的原材料费支出 (单位:万元)与销售额 (单位:万元)之间有如下数据,根据表中
10、提供的全部 数据,用最小二乘法得出 与 的线性回归方程为,则 为( ) = 8.5 + 24568 2535605575 A.B.C.D. 7.51012.517.5 【答案】A 【解析】 【分析】 根据回归直线经过样本平均数中心点,求得平均值 ,代入即可求得 b (,) 【详解】 = 2 + 4 + 5 + 6 + 8 5 = 5 = 25 + 35 + 60 + 55 + 75 5 = 50 因为回归直线方程经过样本中心点,代入回归直线方程得 (5,50) = 508.5 5 = 7.5 所以选 A 【点睛】 本题考查了回归直线的简单应用,注意回归直线会经过平均数中心点,而不是某个样本点,
11、属于基础题 2.假设有两个变量 与 的列联表如下表: 2 2 12 1 2 对于以下数据,对同一样本能说明 与 有关系的可能性最大的一组为( ) A.,B., = 2 = 3 = 4 = 5 = 5 = 3 = 3 = 4 C.,D., = 3 = 6 = 2 = 5 = 5 = 3 = 4 = 3 【答案】B 【解析】 【分析】 当 ad 与 bc 差距越大,两个变量有关的可能性就越大,检验四个选项中所给的 ad 与 bc 的差距,只有第二个选项差距大,得到结 果 【详解】 解:根据观测值求解的公式可以知道, 当 ad 与 bc 差距越大,两个变量有关的可能性就越大, 检验四个选项中所给的
12、ad 与 bc 的差距: : = 10 12 = 2: = 20 9 = 11 : = 15 12 = 3: = 15 12 = 3 显然 中最大. 故答案为B. | | 【点睛】 本题考查独立性检验,得出 ad 与 bc 差距越大,两个变量有关的可能性就越大是解决问题的关键,属基础题 3.已知两个变量 和 之间有线性相关关系,经调查得到如下样本数据, 34567 3.52.41.1-0.2-1.3 根据表格中的数据求得同归方程,则下列说法正确的是( ) = + A.,B., 0 0 0 0 C.,D., 0 0 0 【答案】B 【解析】 【分析】 根据已知数据,可知变量 和变量 之间存在负相
13、关的关系,即可判断出,再令,可求出,即可得出答 3.5 0 案. 【详解】 解:由已知数据,可知 随着 的增大而减小, 则变量 和变量 之间存在负相关的关系, 3.5 0 即:, 0 7.879 故至少有 99.5%的把握认为偏爱蔬菜与偏爱肉类与性别有关, 故选:C 【点睛】 本题考查了独立性检验,解题关键是计算出观测值,属于基础题. 二、多选题(共 10 分) 5.有关独立性检验的四个命题,其中正确的是( ) A.两个变量的 22 列联表中,对角线上数据的乘积相差越大,说明两个变量有关系成立的可能性就越大 B.对分类变量 X 与 Y 的随机变量的观测值 k 来说,k 越小, “X 与 Y 有
14、关系”的可信程度越小 2 C.从独立性检验可知:有 95%的把握认为秃顶与患心脏病有关,我们说某人秃顶,那么他有 95%的可能患有心脏病 D.从独立性检验可知:有 99%的把握认为吸烟与患肺癌有关,是指在犯错误的概率不超过 1%的前提下认为吸烟与患肺癌有关 【答案】ABD 【解析】 【分析】 观测值越大,两个变量有关系的可能性越大,选项 正确;根据独立性检验,观测值越小,两个有关系的可信度越低,选项 22 正确;独立性检验的结论适合于群体的可能性,不能认为是必然情况,选项 不正确;根据独立性的解释,选项 正确. 【详解】 选项 ,两个变量的 22 列联表中,对角线上数据的乘积相差越大, 则观测
15、值越大,两个变量有关系的可能性越大,所以选项 正确; 2 选项 ,根据的观测值 越小,原假设“X 与 Y 没关系”成立的可能性越大, 2 则“X 与 Y 有关系”的可信度越小,所以选项 正确; 选项 ,从独立性检验可知:有 95%的把握认为秃顶与患心脏病有关, 不表示某人秃顶他有 95%的可能患有心脏病,所以选项 不正确; 选项 ,从独立性检验可知:有 99%的把握认为吸烟与患肺癌有关, 是指在犯错误的概率不超过 1%的前提下认为吸烟与患肺癌有关, 是独立性检验的解释,所以选项 正确. 故选:ABD. 【点睛】 本题考查独立性检验概念辨析、观测值与独立性检验的关系,意在考查概念的理解,属于基础
16、题. 2 6.下列说法: 对于独立性检验,的值越大,说明两事件相关程度越大; 2 以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则 , 的值分别是 = = = 0.3 + 4 和 0.3; 4 已知随机变量,若,则 ()的值为; (0,2)(| 2 1 2 通过回归直线及回归系数 ,可以精确反映变量的取值和变化趋势 = + 其中错误的选项是( ) A.B.C.D. 【答案】AD 【解析】 【分析】 根据正态分布,回归分析,以及独立性检验等知识,对选项进行逐一分析即可. 【详解】 的观测值不是刻画两个分类变量之间的关系,故错误; 2 则 , 的值分别是和 0.3,故正确;
17、 = + = 0.3 + 44 已知随机变量,故由对称性可知, (0,2)(| 2 1 2 通过回归直线及回归系数 ,只能大致的(不能精确)反映变量的取值和变化趋势故错误 = + 综上所述,错误的是 故选:AD 【点睛】 本题考查了正态分布、回归分析、独立性检验就等知识,解题时抓住相关概念即可 三、填空题(共 10 分) 7.某校为了研究学生的性别与对待某一活动的态度(支持和不支持两种态度)的关系,运用列联表进行独立性检验,经计算 2 2 ,则所得到的统计学结论是:有_的把握认为“学生性别与是否支持该活动有关系”. 2= 6.669% 附: (2 0)0.1000.0500.0250.0100
18、.001 0 2.7063.8415.0246.63510.828 【答案】99 【解析】 【分析】 根据的值,结合参考表格,计算出犯错的概率,即可求得有把握的概率. 2 【详解】 因为 6.669 大于表格中的数据 6.635,所以得到的统计学结论是: 有的把握认为“学生性别与是否支持该活动有关系”, 10.010 = 0.99 = 99% 故答案为:99. 【点睛】 本题考查独立性检验时,由的值,如何读取结果,属基础题. 2 8.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了 8 次试验,收集数据如下: 零件个数 1020304050607080 加工时间 626875
19、818995102108 设回归直线方程为,若,则点在直线的_方 = + = 2 3(,)4520 = 0 【答案】右下方 【解析】 【分析】 利用线性回归系数的公式求出 的值,从而确定点在直线的位置关系 (,)4520 = 0 【详解】 由题意可得:, = 10 + 20 + 30 + 40 + 50 + 60 + 70 + 80 8 = 45 = 62 + 68 + 75 + 81 + 89 + 95 + 102 + 108 8 = 85 则 ,故点为 在直线右下方 = = 852 3 45 = 55 (,) (55,2 3)4520 = 0 【点睛】 本题考查线性回归系数的确定,考查线性
20、规划,解题的关键是确定线性回归系数,属于基础题 四、解答题(共 34 分) 9.从中国教育在线官方公布的考研动机调查来看,本科生扎堆考研的原因大概集中在这 6 个方面:本科就业压力大,提升竞争力; 通过考研选择真正感兴趣的专业;为了获得学历;继续深造;随大流;有名校情结.如图是 20152019 年全国硕士研究生报考人 数趋势图(单位:万人)的折线图. (1)求 关于 的线性回归方程; (2)根据(1)中的回归方程,预测 2021 年全国硕士研究生报考人数. 参考数据:. 5 = 1()() = 311 回归方程中斜率和截距的最小二乘估计公式分别:,. = + = = 1()() = 1()
21、2 = 【答案】 (1);(2)338.6 万人. = 31.1 + 120.9 【解析】 【分析】 (1)根据所给数据求出样本平均数以及对应的系数即可求得 关于 的线性回归方程;(2)令代入所得线性回归方程即可求 = 7 得预测值. 【详解】 (1)由题中数据计算得, = 1 5(1 + 2 + 3 + 4 + 5) = 3 , = 165 + 177 + 201 + 238 + 290 5 = 214.2 , 5 = 1() 2= (2)2+ (1)2+ 03+ 12+ 22= 10 由参考数据知, 5 = 1()() = 311 所以, = 5 = 1()() 5 = 1() 2 = 3
22、11 10 = 31.1 , = = 214.231.1 3 = 120.9 故所求回归方程为. = 31.1 + 120.9 (2)将 2021 年对应的代人回归方程得, = 7 = 31.1 7 + 120.9 = 338.6 所以预测 2021 年全国硕士研究生报考人数约为 338.6 万人. 【点睛】 本题考查线性回归方程,最小二乘估计,属于基础题. 10.某学校为了了解该校高三年级学生寒假在家自主学习的情况,随机对该校 300 名高三学生寒假的每天学习时间(单位:h)进 行统计,按照,的分组作出频率分布直方图如图所示 0,2(2,4(4,6(6,8(8,10 ()根据频率分布直方图计
23、算该校高三年级学生的平均每天学习时间(同一组中的数据用该组区间中点值代表) ; ()该校规定学习时间超过 4h 为合格,否则不合格已知这 300 名学生中男生有 140 人,其中合格的有 70 人,请补全下表, 根据表中数据,能否有 99.9%的把握认为该校高三年级学生的性别与学习时长合格有关? 男生女生总计 不合格 合格70 总计140160300 参考公式:,其中 2= ()2 ( + )( + )( + )( + ) = + + + 参考附表: (2 0)0.0500.0100.001 0 3.8416.63510.828 【答案】 ()4.36;()有 99.9%的把握认为该校高三年级
24、学生的性别与学习时长合格有关 【解析】 【分析】 ()根据频率分布直方图直接计算平均值即可; ()先求出 300 名学生中合格的人数,再补全表格,然后根据表格数据和公式计算,最后将与进行比较,进而得出结论. 22 0 【详解】 ()高三年级学生平均每天的学习时间为: (h); 2 (0.04 1 + 0.16 3 + 0.23 5 + 0.06 7 + 0.01 9) = 4.36 ()300 名学生中合格的人数为(人), 300 2 (0.23 + 0.06 + 0.01) = 180 故补全表格如下: 男生女生总计 不合格7050120 合格70110180 总计140160300 所以,
25、 2= ()2 ( + )( + )( + )( + ) = 300 (70 11050 70)2 120 180 140 160 = 10.9375 10.828 所以有 99.9%的把握认为该校高三年级学生的性别与学习时长合格有关. 【点睛】 本题考查了根据频率分布直方图求均值,考查了独立性检验,难度不大. 11.某班级数学兴趣小组为了研究人脚的大小与身高的关系,随机抽测了 20 位同学,得到如下数据: 序号12345678910 身高 (厘米) 192164172177176159171166182166 脚长 (码) 48384043443740394639 序号11121314151
26、617181920 身高 (厘米) 169178167174168179165170162170 脚长 (码) 43414043404438423941 (1)若“身高大于 175 厘米”为“高个” , “身高小于等于 175 厘米”的为“非高个” ;“脚长大于 42 码”为“大码” , “脚长小 于等于 42 码”的为“非大码”.请根据上表数据完成列联表,求出的值(结果精确到小数点后三位有效数字),并说明有 2 22 多大的可靠性认为“脚的大小与身高之间有关系” ; (2)请根据“序号为 5 的倍数”的几组数据,求出 关于 的线性回归方程. = + 附表及公式: (2 )0.150.100.
27、050.0250.0100.0050.001 2.0722.7063.8415.0246.6357.87910.828 ; 2= ()2 ( + )( + )( + )( + ) = = 1()() = 1() 2 = 【答案】 (1)列联表答案见解析,有的把握认为,人的脚的大小与身高之间有关系(2) 2 22 8.80299.5% = 1 2 + 44 【解析】 【分析】 (1)根据题意,即可容易补充完整表格,结合表格数据,计算,故可判断; 2 (2)分别计算的平均数,根据公式求得,则问题得解. , 【详解】 (1)根据题意,填写列联表如下: 2 2 高个非高个合计 大脚516 非大脚212
28、14 合计71320 由表中数据,计算, 2= 20 (5 121 2)2 6 14 13 7 8.802 7.879 所以,有的把握认为,人的脚的大小与身高之间有关系; 99.5% (2) “序号为 5 的倍数”的数据有 4 组: ; 1= 176,2= 166,3= 168,4= 170 ; 1= 44,2= 39,3= 40,4= 41 则, = 1 4 (176 + 166 + 168 + 170) = 170 , = 1 4 (44 + 39 + 40 + 41) = 41 所以 , = (176170) (4441) + (166170) (3941) + (168170) (4041) + (170170) (4141) (176170)2+ (166170)2+ (168170)2+ (170170)2 = 1 2 = = 411 2 170 = 44 从而 关于 的线性回归方程是. = 1 2 + 44 【点睛】 本题考查的计算,以及线性回归方程的求解,属综合基础题. 2
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。