1、 统计与统计案例统计与统计案例 1.(2019 全国卷)演讲比赛共有 9 位评委分别给出某选手的原始评分,评定该选 手的成绩时,从 9 个原始评分中去掉 1 个最高分、1 个最低分,得到 7 个有效评 分.7 个有效评分与 9 个原始评分相比,不变的数字特征是( ) A.中位数 B.平均数 C.方差 D.极差 解析 中位数是将 9 个数据从小到大或从大到小排列后,处于中间位置的数据, 因而去掉 1 个最高分和 1 个最低分,中位数是不变的,平均数、方差、极差均受 影响. 答案 A 2.(2020 全国卷)在一组样本数据中,1,2,3,4 出现的频率分别为 p1,p2, p3,p4,且 4 i1
2、pi1,则下面四种情形中,对应样本的标准差最大的一组是( ) A.p1p40.1,p2p30.4 B.p1p40.4,p2p30.1 C.p1p40.2,p2p30.3 D.p1p40.3,p2p30.2 解析 X 的可能取值为 1,2,3,4,四种情形的数学期望 E(X)1p12p2 3p34p4都为 2.5,方差 D(X)1E(X)2p12E(X)2p23 E(X)2p34E(X)2p4,标准差为 D(X). A 选项的方差 D(X)0.65;B 选项的方差 D(X)1.85;C 选项的方差 D(X) 1.05;D 选项的方差 D(X)1.45. 可知选项 B 的情形对应样本的标准差最大.
3、故选 B. 答案 B 3.(2020 天津卷)从一批零件中抽取 80 个,测量其直径(单位:mm),将所得数据 分为 9 组:5.31,5.33),5.33,5.35),5.45,5.47),5.47,5.49,并整理 得到如下频率分布直方图,则在被抽取的零件中,直径落在区间5.43,5.47)内 的个数为( ) A.10 B.18 C.20 D.36 解析 因为直径落在区间5.43,5.47)内的频率为 0.02(6.255.00)0.225,所 以个数为 0.2258018.故选 B. 答案 B 4.(2020 全国卷)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量 有所增加.为调
4、查该地区某种野生动物的数量,将其分成面积相近的200个地块, 从这些地块中用简单随机抽样的方法抽取 20 个作为样区,调查得到样本数据 (xi,yi)(i1,2,20),其中 xi和 yi分别表示第 i 个样区的植物覆盖面积(单 位:公顷)和这种野生动物的数量,并计算得 20 i1xi60, 20 i1yi1 200, 20 i1 (xix )2 80, 20 i1 (yiy )29 000, 20 i1 (xix )(yiy )800. (1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这 种野生动物数量的平均数乘以地块数); (2)求样本(xi,yi)(i1,2,20
5、)的相关系数(精确到 0.01); (3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以 获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方 法,并说明理由. 附:相关系数 r n i1 (xix )(yiy ) n i1 (xix )2 n i1 (yiy )2 , 21.414. 解 (1)由已知得样本平均数y 1 20 20 i1yi60,从而该地区这种野生动物数量的估 计值为 6020012 000. (2)样本(xi,yi)(i1,2,20)的相关系数 r 20 i1 (xix )(yiy ) 20 i1 (xix )2 20 i1 (yiy
6、 )2 800 809 000 2 2 3 0.94. (3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽 样. 理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关 性.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异 也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高 了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计. 考 点 整 合 1.抽样方法 抽样方法包括简单随机抽样、分层抽样,两种抽样方法都是等概率抽样,体现了 抽样的公平性,但又各有其特点和适用范围. 2.统计中的四个数据特征 (1)
7、众数:在样本数据中,出现次数最多的那个数据. (2)中位数:在样本数据中,将数据按大小顺序排列,位于最中间的数据.如果数 据的个数为偶数,就取中间两个数据的平均数作为中位数. (3)平均数:样本数据的算术平均数,即x 1 n(x1x2xn). (4)方差与标准差. s21 n(x1x )2(x2x )2(xnx )2, s 1 n(x1x )2(x2x )2(xnx )2. 3.直方图的两个结论 (1)小长方形的面积组距频率 组距频率. (2)各小长方形的面积之和等于 1. 4.回归分析与独立性检验 (1)回归直线y b xa 经过样本点的中心(x ,y ),若 x 取某一个值代入回归直线方
8、程y b xa 中,可求出 y 的估计值. (2)独立性检验 对于取值分别是x1,x2和y1,y2的分类变量 X 和 Y,其样本频数列联表是: y1 y2 总计 x1 a b ab x2 c d cd 总计 ac bd n 则 K2 n(adbc)2 (ab)(cd)(ac)(bd)(其中 nabcd 为样本容 量). 热点一 抽样方法 【例 1】 (1)总体由编号为 01,02,49,50 的 50 个个体组成,利用下面的随 机数表选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始 从左到右依次选取两个数字,则选出的第 4 个个体的编号为( ) 附:第 6 行至第 9 行的随
9、机数表 2748 6198 7164 4148 7086 2888 8519 1620 7477 0111 1630 2404 2979 7991 9683 5125 3211 4919 7306 4916 7677 8733 9974 6732 2635 7900 3370 9160 1620 3882 7757 4950 A.3 B.19 C.38 D.20 (2)(2020 百校大联考)在新冠肺炎疫情期间,大多数学生都进行网上上课.我校高 一、高二、高三共有学生 1 800 名,为了了解同学们对“钉钉”授课软件的意 见,计划采用分层抽样的方法从这1 800名学生中抽取一个容量为72的样本
10、.若从 高一、高二、高三抽取的人数恰好是从小到大排列的连续偶数,则我校高三年级 的人数为( ) A.800 B.750 C.700 D.650 解析 (1)由题意知,编号为 0150 的个体才是需要的个体.由随机数表依次可得 41,48,28,19,16,20,故第 4 个个体的编号为 19.故选 B. (2)设从高三年级抽取的学生人数为 2x 人,则从高二、高一年级抽取的人数分别 为 2x2,2x4. 由题意可得 2x(2x2)(2x4)72,x13. 设我校高三年级的学生人数为 N,且高三抽取 26 人, 由分层抽样,得 N 1 800 26 72,N650(人). 答案 (1)B (2)
11、D 探究提高 解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但 无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量与总 体容量的比值. 【训练 1】 (1)总体由编号为 01,02,19,20 的 20 个个体组成.利用下面的 随机数表选取 5 个个体,选取方法是从随机数表第 1 行第 6 列的数字开始,由左 到右依次选取两个数字,则选出来的第 5 个个体的编号为_. 附:第 1 行至第 2 行的随机数表 21 16 65 08 90 34 20 76 43 81 26 34 91 64 17 50 71 59 45 06 91 27 35 36 80 72 74
12、67 21 33 50 25 83 12 02 76 11 87 05 26 (2)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为 200,400, 300,100 件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽 取 60 件进行检验,则应从丙种型号的产品中抽取_件. 解析 (1)从随机数表的第1行第6列的数字开始,按规则得到的编号依次为50, 89,03,42,07,64,38,12,63,49,16,41,75,07,15,94,50,其 中编号在01至 20之间的依次为 03,07,12,16,07,15,按照编号重复的 删除后一个的原则,可知选出来的第 5 个个体
13、的编号为 15. (2)因为样本容量 n60,总体容量 N2004003001001 000,所以抽取比 例为n N 60 1000 3 50. 因此应从丙种型号的产品中抽取 300 3 5018(件). 答案 (1)15 (2)18 热点二 用样本估计总体 角度 1 数字特征与统计图表的应用 【例 2】 (1)(2020 衡水检测)甲、乙两名同学高三以来 6 次数学模拟考试的成绩统 计如下图,甲、乙两组数据的平均数分别为x 甲、x 乙,标准差分别为 s甲、s乙,则 ( ) A.x 甲x 乙,s甲s乙 B.x 甲x 乙,s甲s乙 C.x 甲x 乙,s甲s乙 D.x 甲x 乙,s甲s乙 (2)2
14、020 年初,我国突发新冠肺炎疫情,疫情期间中小学生“停课不停学”.已知 某地区中小学生人数情况如甲图所示,各学段学生在疫情期间“家务劳动”的参 与率如乙图所示.为了进一步了解该地区中小学生参与“家务劳动”的情况,现 用分层抽样的方法抽取 4%的学生进行调查,则抽取的样本容量、抽取的高中生 中参与“家务劳动”的人数分别为( ) A.2 750,200 B.2 750,110 C.1 120,110 D.1 120,200 解析 (1)由统计图知,甲同学的总体成绩要好于乙同学的成绩,且乙同学的成 绩波动较大,甲同学成绩较稳定.x 甲x 乙,且 s甲s乙. (2)学生总数为15 5005 0007
15、 50028 000人,由于抽取4%的学生进行调查, 则抽取的样本容量为 28 0004%1 120(人).故高中生应抽取的人数为 5 0004%200(人),而高中生中参与“家务劳动”的比率为 0.55,故高中生中 参与“家务劳动”的人数为 2000.55110(人). 答案 (1)C (2)C 角度 2 用样本的频率分布估计总体分布 【例 3】 (2019 全国卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如 下试验:将 200 只小鼠随机分成 A,B 两组,每组 100 只,其中 A 组小鼠给服甲 离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度 相同.经过一
16、段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据 试验数据分别得到如下直方图: 记 C 为事件:“乙离子残留在体内的百分比不低于 5.5”,根据直方图得到 P(C) 的估计值为 0.70. (1)求乙离子残留百分比直方图中 a,b 的值; (2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点 值为代表). 解 (1)由已知得 0.70a0.200.15, 故 a0.35, b10.050.150.700.10. (2)甲离子残留百分比的平均值的估计值为 20.1530.2040.3050.2060.1070.054.05. 乙离子残留百分比的平均值的估计值为
17、30.0540.1050.1560.3570.2080.156.00. 探究提高 1.平均数与方差都是重要的数字特征,是对数据的一种简明描述,它 们所反映的情况有着重要的实际意义.平均数、中位数、众数描述数据的集中趋 势,方差和标准差描述数据的波动大小. 2.在例 3 中,抓住频率分布直方图各小长方形的面积之和为 1,这是求解的关 键;本题易混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的 几何意义当成频率,导致样本数据的频率求错. 【训练 2】 (1)(2020 新高考海南卷)我国新冠肺炎疫情防控进入常态化,各地有序 推进复工复产,下面是某地连续 11 天复工复产指数折线图,下列
18、说法正确的是 ( ) A.这 11 天复工指数和复产指数均逐日增加 B.这 11 天期间,复产指数增量大于复工指数的增量 C.第 3 天至第 11 天复工复产指数均超过 80% D.第 9 天至第 11 天复产指数增量大于复工指数的增量 解析 由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少, 第 10 天到第 11 天复工指数减少,第 8 天到第 9 天复产指数减少,故 A 错误;由 图可知,第一天的复产指数与复工指数的差大于第 11 天的复产指数与复工指数 的差,所以这 11 天期间,复产指数增量小于复工指数的增量,故 B 错误;由图 可知,第 3 天至第 11 天复工复产
19、指数均超过 80%,故 C 正确;由图可知,第 9 天至第 11 天复产指数增量大于复工指数的增量,故 D 正确;故选 C、D. 答案 CD (2)(2019 全国卷)某行业主管部门为了解本行业中小企业的生产情况,随机调 查了 100 个企业,得到这些企业第一季度相对于前一年第一季度产值增长率 y 的 频数分布表. y 的分组 0.20,0) 0,0.20) 0.20,0.40) 0.40,0.60) 0.60,0.80 企业数 2 24 53 14 7 分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比 例; 求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用
20、该组区 间的中点值为代表).(精确到 0.01)附: 748.602. 解 根据产值增长率频数分布表得,所调查的 100 个企业中产值增长率不低于 40%的企业频率为147 100 0.21. 产值负增长的企业频率为 2 1000.02. 所以用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比 例为 21%,产值负增长的企业比例为 2%. 100 个企业的产值增长率平均数为 y 1 100(0.1020.10240.30530.50140.707)0.30, s2 1 100 5 i1ni(yiy )2 1 100(0.40) 22(0.20)22402530.20214 0
21、.40270.029 6, s 0.029 60.02 740.17. 所以,这类企业产值增长率的平均数与标准差的估计值分别为 0.30,0.17. 热点三 回归分析在实际问题中的应用 【例 4】 如图是某地区 2000 年至 2016 年环境基础设施投资额 y(单位:亿元)的 折线图. 为了预测该地区 2018 年的环境基础设施投资额,建立了 y 与时间变量 t 的两个线 性回归模型.根据 2000 年至 2016 年的数据(时间变量 t 的值依次为 1,2,17) 建立模型:y 30.413.5t;根据2010年至2016年的数据(时间变量t的值依 次为 1,2,7)建立模型:y 9917
22、.5t. (1)分别利用这两个模型,求该地区 2018 年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由. 解 (1)利用模型,该地区 2018 年的环境基础设施投资额的预测值为y 30.4 13.519226.1(亿元). 利用模型,该地区2018年的环境基础设施投资额的预测值为y 9917.59 256.5(亿元). (2)利用模型得到的预测值更可靠. 理由如下: ()从折线图可以看出,2000 年至 2016 年的数据对应的点没有随机散布在直线 y 30.413.5t 上下,这说明利用 2000 年至 2016 年的数据建立的线性模型不 能很好地描述
23、环境基础设施投资额的趋势.2010 年相对 2009 年的环境基础设施投 资额有明显增加,2010 年至 2016 年的数据对应的点位于一条直线的附近,这说 明从 2010 年开始环境基础设施投资额的变化规律呈线性增长趋势,利用 2010 年 至 2016 年的数据建立的线性模型y 9917.5t 可以较好地描述 2010 年以后的环 境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠. ()从计算结果看,相对于 2016 年的环境基础设施投资额 220 亿元,由模型得 到的预测值 226.1 亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较 合理,说明利用模型得到的预测值更可靠.
24、 探究提高 1.求回归直线方程的关键及实际应用 (1)关键:正确理解b ,a 的计算公式和准确地计算. (2)实际应用:在分析实际中两个变量的相关关系时,可根据样本数据作出散点 图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性 回归方程估计和预测变量的值. 2.相关系数 (1)当 r0 时,表明两个变量正相关;当 r0.75 时,认为两个变量具有较强的线性相关关系. 【训练 3】 (1)(2020 全国卷)某校一个课外学习小组为研究某作物种子的发芽率 y 和温度 x(单位:)的关系,在 20 个不同的温度条件下进行种子发芽实验,由 实验数据(xi,yi)(i1,2,20)
25、得到下面的散点图: 由此散点图,在 10 至 40 之间,下面四个回归方程类型中最适宜作为发芽率 y 和温度 x 的回归方程类型的是( ) A.yabx B.yabx2 C.yabex D.yabln x (2)(2020 百强名校领军考试)已知变量 x,y 的关系可以用模型 ycekx拟合,设 z ln y,其变换后得到一组数据如下: x 16 17 18 19 z 50 34 41 31 由上表可得线性回归方程z 4xa ,则 c( ) A.4 B.e 4 C.109 D.e109 解析 (1)由散点图可以看出,这些点大致分布在对数型函数的图象附近.故选 D. (2)由数据表知x 17.5
26、,z 39. 样本点中心(x ,z )在回归直线上, a 39417.5109. 又 zln yln(cekx)kxln c, ln ca 109,则 ce109. 答案 (1)D (2)D 热点四 独立性检验 【例 5】 (2020 新高考山东、海南卷)为加强环境保护,治理空气污染,环境监测 部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单 位:g/m3),得下表: SO2 PM2.5 0,50 (50,150 (150,475 0,35 32 18 4 (35,75 6 8 12 (75,115 3 7 10 (1)估计事件“该市一天空气中PM2.5浓度不超
27、过75,且SO2浓度不超过150”的 概率; (2)根据所给数据,完成下面的 22 列联表: SO2 PM2.5 0,150 (150,475 0,75 (75,115 (3)根据(2)中的列联表,判断是否有 99%的把握认为该市一天空气中 PM2.5 浓度 与 SO2浓度有关? 附:K2 n(adbc)2 (ab)(cd)(ac)(bd), P(K2k0) 0.050 0.010 0.001 k0 3.841 6.635 10.828 解 (1)根据抽查数据,该市 100 天的空气中 PM2.5 浓度不超过 75,且 SO2浓度 不超过150的天数为32186864,因此,该市一天空气中PM
28、2.5浓度不超 过 75,且 SO2浓度不超过 150 的概率的估计值为 64 1000.64. (2)根据抽查数据,可得 22 列联表: SO2 PM2.5 0,150 (150,475 0,75 64 16 (75,115 10 10 (3)根据(2)的列联表得 K2的观测值 k100(64101610) 2 80207426 7.484. 由于 7.4846.635,故有 99%的把握认为该市一天空气中 PM2.5 浓度与 SO2浓度 有关. 探究提高 1.独立性检验的一般步骤 (1)根据样本数据列成 22 列联表; (2)根据公式 K2 n(adbc)2 (ab)(cd)(ac)(bd
29、),计算 K 2 的值; (3)查表比较 K2与临界值的大小关系,作统计判断. 2.K2的观测值 k 越大,对应假设事件 H0成立(两类变量相互独立)的概率越小,H0 不成立的概率越大. 【训练 4】 某商场为提高服务质量,随机调查了 50 名男顾客和 50 名女顾客,每 位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表: 满意 不满意 男顾客 40 10 女顾客 30 20 (1)分别估计男、女顾客对该商场服务满意的概率; (2)能否有 95%的把握认为男、女顾客对该商场服务的评价有差异? 附:K2 n(adbc)2 (ab)(cd)(ac)(bd). P(K2k0) 0.050
30、0.010 0.001 k0 3.841 6.635 10.828 解 (1)由调查数据,男顾客中对该商场服务满意的比率为40 500.8,因此男顾客 对该商场服务满意的概率的估计值为 0.8.女顾客中对该商场服务满意的比率为30 50 0.6,因此女顾客对该商场服务满意的概率的估计值为 0.6. (2)K2的观测值 k100(40203010) 2 50507030 4.762. 由于 4.7623.841,故有 95%的把握认为男、女顾客对该商场服务的评价有差异. A 级 巩固提升 一、选择题 1.西游记三国演义水浒传和红楼梦是中国古典文学瑰宝,并称 为中国古典小说四大名著.某中学为了解本
31、校学生阅读四大名著的情况,随机调 查了 100 位学生,其中阅读过西游记或红楼梦的学生共有 90 位,阅读过 红楼梦的学生共有 80 位,阅读过西游记且阅读过红楼梦的学生共有 60 位,则该校阅读过 西游记 的学生人数与该校学生总数比值的估计值为( ) A.0.5 B.0.6 C.0.7 D.0.8 解析 法一 设调查的 100 位学生中阅读过西游记的学生人数为 x,则 x80 6090,解得 x70, 所以该校阅读过西游记的学生人数与该校学生总数比值的估计值为 70 1000.7. 故选 C. 法二 用 Venn 图表示阅读过西游记和红楼梦的人数之间的关系如图: 易知调查的 100 位学生中
32、阅读过 西游记 的学生人数为 70,所以该校阅读过 西 游记的学生人数与该校学生总数比值的估计值为 70 1000.7. 答案 C 2.(2020 全国卷)设一组样本数据 x1,x2,xn的方差为 0.01,则数据 10 x1, 10 x2,10 xn的方差为( ) A.0.01 B.0.1 C.1 D.10 解析 10 x1,10 x2,10 xn的方差为 1020.011.故选 C. 答案 C 3.给出如下列联表 患心脏病 患其他病 总计 高血压 20 10 30 非高血压 30 50 80 总计 50 60 110 P(K210.828)0.001,P(K26.635)0.010,参照公
33、式k n(adbc)2 (ab)(cd)(ac)(bd),得到的正确结论是( ) A.有 99%以上的把握认为“高血压与患心脏病无关” B.有 99%以上的把握认为“高血压与患心脏病有关” C.在犯错误的概率不超过 0.1%的前提下,认为“高血压与患心脏病无关” D.在犯错误的概率不超过 0.1%的前提下,认为“高血压与患心脏病有关” 解析 由列联表中的数据可得 K2的观测值 k110(20501030) 2 30805060 7.4866.635, 根据参考数据 P(K26.635)0.01,P(K210.828)0.001, 所以有 10.0199%的把握认为高血压与患心脏病有关,即有 9
34、9%以上的把握 认为高血压与患心脏病有关. 答案 B 4.(多选题)(2020 济南调研)某企业对本企业 1 644 名职工关于复工的态度进行调 查,调查结果如图所示,下列结论成立的是( ) 疫情防控期间某企业复工职工调查 A.x0.384 B.从该企业中任取一名职工,该职工是倾向于在家办公的概率为 0.178 C.不到 80 名职工倾向于继续申请休假 D.倾向于复工后在家办公或在公司办公的职工超过 986 名 解析 由图表知 x%15.1%17.8%42.3%,得x34.8,则 A 错.在家办公的 人员占 17.8%,B 正确.由 1 6445.1%16445%82.280,超过 80 名职
35、工 倾向于休假,故C 错误.又1 644(17.8%42.3%)988,所以超过986 名职工倾 向于在家办公或在公司办公,D 正确.综上可知,正确的结论为 BD. 答案 BD 5.(多选题)某校进行了一次创新作文大赛,共有 100 名同学参赛,经过评判,这 100 名参赛者的得分都在40,90之间,其得分的频率分布直方图如图所示,则 下列结论正确的是( ) A.得分在40,60)之间的共有 40 人 B.从这 100 名参赛者中随机选取 1 人,其得分在60,80)的概率为 0.5 C.估计得分的众数为 55 D.这 100 名参赛者得分的中位数为 65 解析 根据频率和为 1,由(a0.0
36、350.0300.0200.010)101,解得 a 0.005, 得分在40,60)的频率是 0.40,估计得分在40,60)的有 1000.4040(人),A 正确; 得分在60,80)的频率为 0.5,可得从这 100 名参赛者中随机选取一人, 得分在60,80)的概率为 0.5,B 正确; 根据频率分布直方图知,最高的小矩形对应的底边中点为5060 2 55,即估计得 分的众数为 55,C 正确; 由 0.050.350.40.75时认为两个变量有很强的线性相关关系,回归方程y b ta 中斜率和截距 的最小二乘估计公式分别为b n i1 (tit )(yiy ) n i1 (tit
37、)2 ,a y b t . 解 (1)由统计表中的数据和附注中的参考数据得 t 4, 7 i1 (tit )228, 7 i1 (yiy )20.55, 则 7 i1 (tit )(yiy ) 7 i1tiyit 7 i1yi40.1749.322.89, r 2.89 2 70.55 2.89 22.6460.550.99, 因为 0.990.75, 所以销售量 y 与月份代码 t 有很强的线性相关关系. (2)由y 9.32 7 1.331 及(1)得b 7 i1 (tit )(yiy ) 7 i1 (tit )2 2.89 28 0.103. a y b t 1.3310.10340.92, 所以 y 关于 t 的回归方程为y 0.10t0.92. (3)当 t8 时,代入回归方程得y 0.1080.921.72(万件), 第 8 个月的毛利润为 z101.72 817.221.41414.372(万元). 由 14.37215,预测第 8 个月的毛利润不能突破 15 万元.