1、统计主观题统计主观题 题型一:频率分布表、直方图题型一:频率分布表、直方图 典例典例 1 1、某公司为了解用户对其产品的满意度,从某地区随机调查了某公司为了解用户对其产品的满意度,从某地区随机调查了 100100 个用户,得到个用户,得到 用户对产品的满意度评分频率分布用户对产品的满意度评分频率分布表如下:表如下: 组别组别 分组分组 频数频数 频率频率 第一组第一组 50,60 1010 0.10.1 第二第二组组 60,70 2020 0.20.2 第三组第三组 70,80 4040 0.40.4 第四组第四组 80,90 2525 0.250.25 第五组第五组 90,100 5 5 0
2、.050.05 合计合计 100100 1 1 (1 1)根据上面的频率分布表,估计该地区用户对产品的满意度评分超过)根据上面的频率分布表,估计该地区用户对产品的满意度评分超过 7070 分的概率;分的概率; (2 2)请由频率分布表中数据计算众数、中位数,平均数,根据样本估计总体的思想,)请由频率分布表中数据计算众数、中位数,平均数,根据样本估计总体的思想, 若平均分低于若平均分低于 7575 分,视为不满意分,视为不满意. .判断该地区用户对产品是否满意?判断该地区用户对产品是否满意? 典例典例 2 2、某公司为了解所经销商品的使用情况,随机问卷某公司为了解所经销商品的使用情况,随机问卷
3、5050 名使用者,然后根据这名使用者,然后根据这 5050 名的问卷评分数据,统计得到如图所示的频率布直方图,其统计数据分组区间为名的问卷评分数据,统计得到如图所示的频率布直方图,其统计数据分组区间为4040, 5050) ,) ,5050,6060) ,) ,6060,7070) ,) ,7070,8080) ,) ,8080,9090) ,) ,9090,100100 (1 1)求频率分布直方图中)求频率分布直方图中 a a 的值;的值; (2 2)求这)求这 5050 名问卷评分数据的中位数;名问卷评分数据的中位数; (3 3)从评分在)从评分在4040,6060)的问卷者中,随机抽取
4、)的问卷者中,随机抽取 2 2 人,求此人,求此 2 2 人评分都在人评分都在5050,6060)的)的 概率概率 题型二:题型二:茎叶图茎叶图 典例典例 1 1、某良种培育基地正在培育一某良种培育基地正在培育一种小麦新品种种小麦新品种 A.A.将其与原有的一个优良品种将其与原有的一个优良品种 B B 进行对照试验两种小麦各种植了进行对照试验两种小麦各种植了 2525 亩,所得亩产数据亩,所得亩产数据( (单位:千克单位:千克) )如下:如下: 品种品种 A A: 357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,4
5、27,357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427, 430,430,434,443,445,445,451,454430,430,434,443,445,445,451,454 品种品种 B B: 363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403, 40406,407,410,412,
6、415,416,422,4306,407,410,412,415,416,422,430 (1)(1)作出茎叶图;作出茎叶图; (2)(2)通过观察茎叶图,对品种通过观察茎叶图,对品种 A A 与与 B B 的亩产量及其稳定性进行比较,写出统计结的亩产量及其稳定性进行比较,写出统计结 论论 题型三:线性回归题型三:线性回归 典例典例 1 1、越接近高考学生焦虑程度越强,四个高三学生中大约有一个有焦虑症,越接近高考学生焦虑程度越强,四个高三学生中大约有一个有焦虑症, 经有关机构调查,得出距离高考周数与焦虑程度对应的正常值变化情况如下表经有关机构调查,得出距离高考周数与焦虑程度对应的正常值变化情况
7、如下表 周数周数 周数周数 x x 6 6 5 5 4 4 3 3 2 2 1.1. 正常值正常值 y y 5 55 5 6363 7272 8080 9090 9999 其中其中 1 22 1 n ii i n i i x ynxy b xnx , 1 1452 n ii i x y , 2 1 91 n i i x , a ybx (1 1)作出散点图;)作出散点图; (2 2)根据上表数据用最小二乘法求出)根据上表数据用最小二乘法求出 y y 关于关于 x x 的线性回方程的线性回方程 ybxa(精确到(精确到 0.010.01) (3 3)根据经验观测值为正常值的)根据经验观测值为正常
8、值的 0 0.85.851.061.06 为正常,若为正常,若 1.061.061.121.12 为轻度焦为轻度焦 虑,虑,1.121.121.201.20 为中度焦虑,为中度焦虑,1.201.20 及以上为重度焦虑。若为中度焦虑及以上,及以上为重度焦虑。若为中度焦虑及以上, 则要进行心理疏导。若一个则要进行心理疏导。若一个学生在距高考第二周时观测值为学生在距高考第二周时观测值为 103103,则该学生是否,则该学生是否 需要进行心理疏导?需要进行心理疏导? 题型四:非线性回归题型四:非线性回归 典例典例 1 1、 习近平总书记在十九大报告中指出,习近平总书记在十九大报告中指出,必须树立和践行
9、必须树立和践行“绿水青山就是金绿水青山就是金 山银山山银山”的生态文明发展理念,某城市选用某种植物进行绿化,设其中一株幼的生态文明发展理念,某城市选用某种植物进行绿化,设其中一株幼 苗从观察之日起,第苗从观察之日起,第 x x 天的高度为天的高度为 ycmycm,测得一,测得一些些数据图如下表所示:数据图如下表所示: 第第 x x 天天 1 1 4 4 9 9 1616 2525 3636 4949 高度高度 y/cmy/cm 0 0 4 4 7 7 9 9 1111 1212 1313 作出这组数的散点图如下 作出这组数的散点图如下 (1)(1)请根据散点图判断,请根据散点图判断,y axb
10、 与与yc xd中哪一个更适宜作为幼苗高度中哪一个更适宜作为幼苗高度 y y 关于时间关于时间 x x 的回归方程类型的回归方程类型?(?(给出判断即可,不必说明理由给出判断即可,不必说明理由) ) (2)(2)根据根据(1)(1)的判断结果及表中数据,建立的判断结果及表中数据,建立 y y 关于关于 x x 的回归方程,并预测第的回归方程,并预测第 144144 天这株幼苗的高度天这株幼苗的高度( (结果保留结果保留 1 1 位小数位小数).). 附:附: 1 22 1 n ii i n i i x ynxy b xnx , a ybx 参考数据:参考数据: 7 1 i i x 7 1 i
11、i x 7 1 i i y 7 1 () ii i x y 140140 2828 5656 283283 跟踪训练跟踪训练 1 1、某某“双一流双一流A类类”大学就业部从该校大学就业部从该校 20201818 年已就业的大学本科毕业生中随年已就业的大学本科毕业生中随机机 抽取了抽取了 100100 人进行问卷调查,其中一项是他们的月薪收入情况,调查发现,他人进行问卷调查,其中一项是他们的月薪收入情况,调查发现,他 们的月薪收入在人民币们的月薪收入在人民币 1.651.65 万元到万元到 2.352.35 万元之间,根据统计数据分组,得到万元之间,根据统计数据分组,得到 如下的频率分布直方图:
12、如下的频率分布直方图: (1 1)将同一组数据用该区间的中点值作代表,求这)将同一组数据用该区间的中点值作代表,求这 100100 人月薪收入的样本平均人月薪收入的样本平均 数数x; (2 2)该校在某地区就业的)该校在某地区就业的 20182018 届本科毕业生共届本科毕业生共 5050 人,决定于人,决定于 20192019 国庆长假国庆长假 期间举办一次同学联谊会,并收取一定的活动费用,有两种收费方案:期间举办一次同学联谊会,并收取一定的活动费用,有两种收费方案: 方案一:设区间方案一:设区间1.85,2.15,月薪落在区间,月薪落在区间左侧的每人收取左侧的每人收取 400400 元,月
13、薪元,月薪 落在区间落在区间内的每人收取内的每人收取 600600 元,月薪落在区间元,月薪落在区间右侧的每人收取右侧的每人收取 800800 元;元; 方案二:每人按月薪收入的样本平均数的方案二:每人按月薪收入的样本平均数的3%收取;收取; 用该校就业部统计的这用该校就业部统计的这 100100 人月薪收入的样本频率进行估算,哪一种收费方案人月薪收入的样本频率进行估算,哪一种收费方案 能收到更多的费用?能收到更多的费用? 2 2、某学校为了解高二学生学习效果,从高二第一学期期中某学校为了解高二学生学习效果,从高二第一学期期中考试成绩中随机抽取了考试成绩中随机抽取了 2525 名学生的数学成绩
14、(单位:分) ,发现这名学生的数学成绩(单位:分) ,发现这 2525 名学生成绩均在名学生成绩均在 9090150150 分之间,于是按分之间,于是按 90,100,100,110,140,150分成分成 6 6 组,制成频率分布直方图,如图所示:组,制成频率分布直方图,如图所示: (1 1)求)求m的值;的值; (2 2)估计这)估计这 2525 名学生数学成绩的平均数;名学生数学成绩的平均数; (3 3)为进一步了解数学优)为进一步了解数学优等生的情况,该学校准备从分数在等生的情况,该学校准备从分数在130,150内的同学中随机内的同学中随机 选出选出 2 2 名同学作为代表进行座谈,求
15、这两名同学分数在不同名同学作为代表进行座谈,求这两名同学分数在不同组的概率组的概率. . 3 3、某市某市 20102010 年年 4 4 月月 1 1 日日4 4 月月 3030 日对空气污染指数的监测数据如下(主要污染物为日对空气污染指数的监测数据如下(主要污染物为 可吸入颗粒物)可吸入颗粒物): : 61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91, 77,86,81,83,82,82,64,79,86,85,75,71,49,45,77,
16、86,81,83,82,82,64,79,86,85,75,71,49,45, ()()完成频率分布表;完成频率分布表; ()作出频率分布直方图;)作出频率分布直方图; ()根据国家标准,污染指数在)根据国家标准,污染指数在 050050 之间时,空气质量之间时,空气质量为优:在为优:在 5110051100 之间时,为之间时,为 良;在良;在 101150101150 之间时,为轻微污染;在之间时,为轻微污染;在 151200151200 之间时,为轻度污染之间时,为轻度污染 请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价请你依据所给数据和上述标准,对该市的空气质量给出一个简短
17、评价. . 4 4、随着人们经济收入的不断增加,个人购买家庭轿车已不再是一种时尚车的使用费随着人们经济收入的不断增加,个人购买家庭轿车已不再是一种时尚车的使用费 用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常 关心的问题某汽车销售公司做了一次抽样调查,并统计得出某款车的使用年限关心的问题某汽车销售公司做了一次抽样调查,并统计得出某款车的使用年限 x x 与所与所 支出的支出的总费用总费用 y y(万元)有如表的数据资料:(万元)有如表的数据资料: 使用年限使用年限 x x 2 2 3 3
18、4 4 5 5 6 6 总费用总费用 y y 2.22.2 3 3.8.8 5.55.5 6.56.5 7.07.0 (1 1)求线性回归方程)求线性回归方程 ybxa; (2 2)估计使用年限为)估计使用年限为 1212 年时,使用该款车的总费用是多少万元年时,使用该款车的总费用是多少万元? ? 线性回归方程线性回归方程 yabx中斜率和截距用最小二乘法估计计算公式如下:中斜率和截距用最小二乘法估计计算公式如下: 11 2 22 11 nn iiii ii nn ii ii xxyyx ynxy b xxxnx , aybx 5 5、20182018 年,教育部发文确定新高考改革正式启动,湖
19、南、广东、湖北等年,教育部发文确定新高考改革正式启动,湖南、广东、湖北等 8 8 省市开始实省市开始实 行新高考制度, 从行新高考制度, 从 20182018 年下学期的高一年级学生开始实行年下学期的高一年级学生开始实行. .为了适应新高考改革, 某校为了适应新高考改革, 某校 组织了一次新高考质量测评,在成绩统计分析中,高二某班的数学成绩的茎叶图和频率组织了一次新高考质量测评,在成绩统计分析中,高二某班的数学成绩的茎叶图和频率 分布直方图因故都受到不同程度的损坏,但可见部分如下,据此解答如下问题:分布直方图因故都受到不同程度的损坏,但可见部分如下,据此解答如下问题: (1 1)求该班)求该班
20、数学成绩在数学成绩在50,60的频率及全班人数;的频率及全班人数; (2 2)根据频率分布直方图估计该班这次测评的数学平均分;)根据频率分布直方图估计该班这次测评的数学平均分; (3 3) 若规定) 若规定90分及其以上为优秀, 现从该班分数在分及其以上为优秀, 现从该班分数在80分及其以上的试卷中任取分及其以上的试卷中任取2份分份分 析学生得分情况,求在抽取的析学生得分情况,求在抽取的2份试卷中份试卷中至少有至少有1份优秀的概率份优秀的概率. . 6、某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成 某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成. .每件产品的每件
21、产品的 非原料成本非原料成本y(元)与生产该产品的数量(元)与生产该产品的数量x(千件)有关,经统计得到如下数据:(千件)有关,经统计得到如下数据: x 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 y 112112 6161 44.544.5 3535 30.530.5 2828 2525 2424 根据以上数据,绘制了散点图根据以上数据,绘制了散点图. . 观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型 b ya x 和指和指 数函数模型数函数模型 dx yce分别对两个变量的关系进行拟合分别对
22、两个变量的关系进行拟合. .已求得用指数函数模型拟合的回已求得用指数函数模型拟合的回 归方程为归方程为 0.2 96.54 x ye ,ln y与与x的相关系数的相关系数 1 0.94r . . 参考数据(其中参考数据(其中 1 i i u x ) :) : 8 1 ii i u y u 2 u 8 2 1 i i u 8 1 i i y 8 2 1 i i y 0.61 6185.5 2 e 183.4183.4 0.340.34 0.1150.115 1.531.53 360360 22385.522385.5 61.461.4 0.1350.135 (1 1)用反比例函数模型求)用反比例
23、函数模型求y关于关于x的回归方程;的回归方程; (2 2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到)用相关系数判断上述两个模型哪一个拟合效果更好(精确到 0.010.01) ,并用其估计) ,并用其估计 产量为产量为 1010 千件时每件产品的非原料成本;千件时每件产品的非原料成本; (3 3)该企业采)该企业采取订单生产模式(根据订单数量进行生产,即产品全部售出)取订单生产模式(根据订单数量进行生产,即产品全部售出). .根据市场根据市场 调研数据,若该产品单价定为调研数据,若该产品单价定为 100100 元,则签订元,则签订 9 9 千件订单的概率为千件订单的概率为 0.80.
24、8,签订,签订 1010 千件千件 订单的概率为订单的概率为 0.20.2;若单价定为;若单价定为 9090 元,则签订元,则签订 1010 千件订单的概率为千件订单的概率为 0.30.3,签订,签订 1111 千件千件 订单的概率为订单的概率为 0.7.0.7.已知每件产品的原料成本为已知每件产品的原料成本为 1010 元,根据(元,根据(2 2)的结果,企业要想获)的结果,企业要想获 得更高利润,产品单价应选择得更高利润,产品单价应选择 100100 元还是元还是 9090 元,请说明理由元,请说明理由. . 参考公式:对于一组数据参考公式:对于一组数据 11 ,u, 22 ,u,, nn u,其回归直线,其回归直线u的的 斜率和截距的最小二乘估计分别为:斜率和截距的最小二乘估计分别为: 1 2 2 1 n ii i n i i unu unu ,a u ,相关系数,相关系数 1 22 22 11 n ii i nn ii ii unu r unun . .