1、 第第 二二 章章 统计统计 知能整合提升知能整合提升 一、抽样方法一、抽样方法 1抽样方法有抽样方法有:简单随机抽样简单随机抽样、系统抽样系统抽样、分层抽样分层抽样 2三种抽样方法比较三种抽样方法比较 类别类别 共同共同点点 各自特点各自特点 相互联系相互联系 适用范围适用范围 简单随简单随 机抽样机抽样 抽样过程中抽样过程中 每个个体被每个个体被 抽取的概率抽取的概率 是相同的是相同的 从总体中逐个抽取从总体中逐个抽取 总体中的个体数总体中的个体数 较少较少 系统系统 抽样抽样 将总体均分成几个部分,按事将总体均分成几个部分,按事 先确定的规则在各部分抽取先确定的规则在各部分抽取 在第一部
2、分抽样时采在第一部分抽样时采 用简单随机抽样用简单随机抽样 总体中的个体数总体中的个体数 较多较多 分层分层 抽样抽样 将总体分成几层,分层进行抽将总体分成几层,分层进行抽 取取 各层抽样时采用简单各层抽样时采用简单 随机抽样或系统抽样随机抽样或系统抽样 总体由差异明显总体由差异明显 的几部分组成的几部分组成 二、用样本估计总体二、用样本估计总体 1作频率分布直方图的步骤作频率分布直方图的步骤: (1)求极差求极差 (2)决定组距与组数决定组距与组数,注意样本容量越大注意样本容量越大,所分组数越多所分组数越多 (3)将数据分组将数据分组 (4)计算各小组的频率计算各小组的频率,作频率分布表作频
3、率分布表,各小组的频率各小组的频率各小组频数 各小组频数 样本容量样本容量 . (5)画频率分布直方图画频率分布直方图 2茎叶图刻画数据有两个优点茎叶图刻画数据有两个优点:一是所有信息都可以从图中得到一是所有信息都可以从图中得到,二是便二是便 于记录和表示于记录和表示,但数据较多时不方便但数据较多时不方便 3样本的数字特征可分为两大类样本的数字特征可分为两大类:一类是反映样本数据集中趋势的一类是反映样本数据集中趋势的,包括包括 众数众数、中位数和平均数中位数和平均数;另一类是反映样本波动大小的另一类是反映样本波动大小的,包括方差及标准差包括方差及标准差我我 们常通过样本的数字特征估计总体的数字
4、特征们常通过样本的数字特征估计总体的数字特征 4在用样本的频率分布估计总体的分在用样本的频率分布估计总体的分布时应注意布时应注意: (1)对于同一组样本数据对于同一组样本数据,确定的组距不同确定的组距不同,得到的组数及分组也不同得到的组数及分组也不同,绘绘 制的频率分布直方图就会有差异制的频率分布直方图就会有差异,但都是对总体的近似估计但都是对总体的近似估计 (2)应用频率分布直方图时应用频率分布直方图时,需明确纵轴表示的是频率需明确纵轴表示的是频率/组距组距,进而进行相关进而进行相关 计算计算 (3)绘制茎叶图时需注意同一组数据中的相同数据要一一列出绘制茎叶图时需注意同一组数据中的相同数据要
5、一一列出 5在用样本的数字特征估计总体的数字特征时应注意在用样本的数字特征估计总体的数字特征时应注意: (1)任何一个样本数据的改变都会引起平均数的改变任何一个样本数据的改变都会引起平均数的改变特殊情况下特殊情况下,平均数平均数 可能受某几个极端值的影响可能受某几个极端值的影响,而偏离一般情况而偏离一般情况 (2)标准差的平方是方差标准差的平方是方差,标准差的单位与样本数据的单位一致标准差的单位与样本数据的单位一致 (3)用样用样本的平均数和标准差估计总体的平均数和标准差时本的平均数和标准差估计总体的平均数和标准差时,样本的平均数样本的平均数 和标准差只是总体的平均数和标准差的近似和标准差只是
6、总体的平均数和标准差的近似 三、变量的相关关系三、变量的相关关系 1两个随机变量两个随机变量 x 和和 y 之间相关关系的判断方法有之间相关关系的判断方法有: (1)散点图法散点图法:通过散点图通过散点图,观察它们的分布是否存在一定规律观察它们的分布是否存在一定规律,直观地判直观地判 断断 (2)表格表格、关系式法关系式法:结合表格或关系式进行判断结合表格或关系式进行判断 (3)经验法经验法:借助积累的经验进行分析判断借助积累的经验进行分析判断 2用公式求回归方程的一般步骤是用公式求回归方程的一般步骤是: (1)列表列表 (2)计算计算x,y, i1 n x2 i, , i1 n xiyi.
7、(3)代入公式计算代入公式计算b , ,a 的值 的值 (4)写出回归直线方程写出回归直线方程 3学习变量的相关性时学习变量的相关性时: (1)注意通过实例辨析确定性关系注意通过实例辨析确定性关系(函数关系函数关系)与相关关系与相关关系 根据散点图分析两根据散点图分析两 个变量间的相关关系是正相关还是负相关个变量间的相关关系是正相关还是负相关 (2)学会用最小二乘法求已知样本数据的回归直线方程学会用最小二乘法求已知样本数据的回归直线方程用回归直线方程对用回归直线方程对 总体进行估计时总体进行估计时,得到的结果不是准确值得到的结果不是准确值 热点考点例析热点考点例析 抽样方法的应用抽样方法的应用
8、 1应用抽样方法抽取样本时应用抽样方法抽取样本时,应注意以下几点应注意以下几点: (1)用随机数表法抽样时用随机数表法抽样时,对个体所编的号码位数要相等对个体所编的号码位数要相等,当问题所给位数当问题所给位数 不等时不等时, 以位数较多的为准以位数较多的为准, 在位数较少的数前面添在位数较少的数前面添“0”, 凑齐位数凑齐位数 如如 1,2,3, , 20 可凑成可凑成 01,02,03,20. (2)用系统抽样法抽样时用系统抽样法抽样时,如果总体容量如果总体容量 N 能被样本容量能被样本容量 n 整除整除,抽样间隔抽样间隔 为为 kN n ;如果总体容量如果总体容量 N 不能被样本容量不能被
9、样本容量 n 整除整除,先用简单随机抽样法剔除多先用简单随机抽样法剔除多 余个体余个体,抽样间隔抽样间隔 k N n . 2应用三种抽样方法时需搞清楚它们的使用原则应用三种抽样方法时需搞清楚它们的使用原则: (1)当总体容量较小当总体容量较小,样本容量较小时样本容量较小时,制签简单制签简单,号签容易搅匀号签容易搅匀,可采用可采用 抽签法抽签法; (2)当总体容量较大当总体容量较大,样本容量较小时样本容量较小时,可用随机数表法可用随机数表法; (3)当总体容量较大当总体容量较大,样本容量也较大时样本容量也较大时,可用系统抽样法可用系统抽样法; (4)当总体中个体差异较显著时当总体中个体差异较显著
10、时,可采用分层抽样法可采用分层抽样法 特别提醒特别提醒 在选取抽样方法时,必须使总体中每个个体被抽到的机会是均在选取抽样方法时,必须使总体中每个个体被抽到的机会是均 等的,同学们要理解各种抽样方法的特征及适用范围,在解题时灵活选用等的,同学们要理解各种抽样方法的特征及适用范围,在解题时灵活选用 某工厂有某工厂有 1 003 名工人名工人, 从中抽取从中抽取 10 人参加体检人参加体检, 试采用简单随机抽试采用简单随机抽 样和系统抽样进行具体实施样和系统抽样进行具体实施 解析:解析: (1)简单随机抽样:简单随机抽样: 将每一个人编一个号由将每一个人编一个号由 0 001 至至 1 003. 制
11、作大小相同的号签,并写上号码制作大小相同的号签,并写上号码 放入一个大容器内,均匀搅拌放入一个大容器内,均匀搅拌 依次抽取依次抽取 10 个号签个号签 具有这十个编号的人组成一个样本具有这十个编号的人组成一个样本 (2)系统抽样:系统抽样: 将每个人编一个号由将每个人编一个号由 0 001 至至 1 003. 利用随机数表抽取利用随机数表抽取 3 个号,将这个号,将这 3 个人剔除个人剔除 重新编号重新编号 0 001 至至 1 000. 分段分段1 000 10 100,所以,所以 0 001 至至 0 100 为第一段为第一段 在第一段内由简单随机抽样方法抽得一个号在第一段内由简单随机抽样
12、方法抽得一个号 l. 按编号将按编号将 l,100l,900l 共共 10 个号选出,这个号选出,这 10 个号所对应的人组个号所对应的人组 成样本成样本 1某学校共有教师某学校共有教师 490 人人,其中不到其中不到 40 岁的有岁的有 350 人人,40 岁及以上的有岁及以上的有 140 人人为了了解普通话在该校中的推广普及情况为了了解普通话在该校中的推广普及情况,用分层抽样的方法用分层抽样的方法,从全体从全体 教师中抽取一个容量为教师中抽取一个容量为 70 人的样本进行普通话水平测试人的样本进行普通话水平测试, 其中在不到其中在不到 40 岁的教岁的教 师中应抽取的人数为多少人师中应抽取
13、的人数为多少人? 解析:解析: 第一步,确定第一步,确定抽样比抽样比 70 490 1 7; ; 第二步,在不到第二步,在不到 40 岁的教师中应抽取的人数为岁的教师中应抽取的人数为 3501 7 50(人人); 第三步,由以上的计算可知其中在不到第三步,由以上的计算可知其中在不到 40 岁的教师中应抽取的人数为岁的教师中应抽取的人数为 50 人人 用样本频率分布估计总体分布用样本频率分布估计总体分布 1用样本频率分布估计总体频率分布时用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列通常要对给定的一组数据进行列 表表、作图处理作图处理 2茎叶图刻画数据有两个优点茎叶图刻画数据有两
14、个优点:一是所有信息都可以从图中得到一是所有信息都可以从图中得到,二是便二是便 于记录和表示于记录和表示 某车站在春运期间为了改进服务某车站在春运期间为了改进服务, 随机抽样调查了随机抽样调查了 100 名旅客从开始名旅客从开始 在购票窗口排队到购到车票所用的时间在购票窗口排队到购到车票所用的时间 t(以下简称购票用时以下简称购票用时,单位单位:min)下面下面 是这次抽样的频率分布表和频率分布直方图是这次抽样的频率分布表和频率分布直方图,解答下列问题解答下列问题: 分组分组 频数频数 频率频率 第一组第一组 0t5 0 0 第二组第二组 5t10 10 第三组第三组 10t15 10 0.1
15、0 第四组第四组 15t20 第五组第五组 20t25 30 0.30 合计合计 100 1.00 (1)这次抽样的样本容量是多少这次抽样的样本容量是多少? (2)在表中填写出缺失的数据并补全频率分布直方图在表中填写出缺失的数据并补全频率分布直方图; (3)旅客购票用时的平均数可能落在哪一小组旅客购票用时的平均数可能落在哪一小组? (4)若每增加一个购票窗口可使平均购票用时减少若每增加一个购票窗口可使平均购票用时减少 5 min, 要使平均购票用时要使平均购票用时 不超过不超过 10 min,那么你估计至少要增加几个窗口那么你估计至少要增加几个窗口? 解析:解析: (1)调查的旅客共调查的旅客
16、共 100 名,因而样本容量为名,因而样本容量为 100. (2)由频数之和为由频数之和为 100, 频率, 频率 频数频数 样本容量样本容量可补全频率分布表和频率分布直方图 可补全频率分布表和频率分布直方图 (图中的阴影部分图中的阴影部分)其中,第四组的频数为其中,第四组的频数为 50,频率为,频率为 0.50,第二组的频率为,第二组的频率为 0.10. (3)设旅客平均购票时间为设旅客平均购票时间为 s min,则有,则有 00510101015502030 100 s 5 01010151020502530 100 , 即即 15s20. 旅客购票用时的平均数可能落在第四小组旅客购票用时
17、的平均数可能落在第四小组 (4)设需增加设需增加 x 个窗口,个窗口, 则则 205x10,解得,解得 x2. 至少需要增加至少需要增加 2 个窗口个窗口 2在某次法律知识竞赛中在某次法律知识竞赛中,将来自不将来自不同学校的学生的成绩绘制成如图所示同学校的学生的成绩绘制成如图所示 的频率分布直方图的频率分布直方图已知成绩在已知成绩在60,70)内的学生有内的学生有 40 人人,则成绩在则成绩在70,90)内的内的 学生有学生有_人人 解析:解析: 成绩在区间成绩在区间60,70)内的学生人数的频率为内的学生人数的频率为 0.04100.4,因此学,因此学 生总人数为生总人数为 40 0.4 1
18、00.又成绩在区间又成绩在区间70,90)内的学生人数是成绩在区间内的学生人数是成绩在区间70,80)和和 80,90)内的学生人数的和,这两个小区间相对应的小矩形的面积的和为内的学生人数的和,这两个小区间相对应的小矩形的面积的和为(0.015 0.01)100.25,此即为成绩在区间,此即为成绩在区间70,90)内的学生人数的频率,因此成绩在内的学生人数的频率,因此成绩在 70,90)内的学生有内的学生有 1000.2525(人人) 答案:答案: 25 用样本的数字特征估计总体的数字特征用样本的数字特征估计总体的数字特征 为了从整体上更好地把握总体的规律为了从整体上更好地把握总体的规律, 还
19、可以通过样本数据的众数还可以通过样本数据的众数、 中位数中位数、 平均数和标准差等数字特征对总体的数字特征作出估计平均数和标准差等数字特征对总体的数字特征作出估计 众数就是样本数据中出众数就是样本数据中出 现最多的那个值现最多的那个值;中位数就是处于中间位置的那个数中位数就是处于中间位置的那个数(或者两个数的平均数或者两个数的平均数);平平 均数就是所有样本数据的平均值均数就是所有样本数据的平均值,用用x表示表示;标准差是反映样本数据分散程度大标准差是反映样本数据分散程度大 小的最常用统计量小的最常用统计量,其计算公式为其计算公式为: s 1 n x1 x 2 x2x 2 xnx 2 有时也用
20、标准差的平方有时也用标准差的平方 s2方差来代替标准差方差来代替标准差,实质一样实质一样 甲甲、乙两人在相同的条件下各射靶乙两人在相同的条件下各射靶 10 次次,每次射靶成绩每次射靶成绩(单位单位:环环) 如图所示如图所示 (1)填写下表填写下表: 平均数平均数 方差方差 中位数中位数 命中命中 9 环及以环及以上上 甲甲 7 1.2 1 乙乙 5.4 3 (2)请从四个不同的角度对这次测试进行分析请从四个不同的角度对这次测试进行分析: 从平均数和方差结合分析偏离程度从平均数和方差结合分析偏离程度; 从平均数和中位数结合分析谁的成绩好些从平均数和中位数结合分析谁的成绩好些; 从平均数和命中从平
21、均数和命中 9 环以上的次数相结合看谁的成绩好些环以上的次数相结合看谁的成绩好些; 从折线图上看两人射击命中环数及走势分析谁更有潜力从折线图上看两人射击命中环数及走势分析谁更有潜力 解析:解析: (1)乙的射靶环数依次为乙的射靶环数依次为 2,4,6,8,7,7,8,9,9,10,所以,所以x乙 乙 1 10(2 46 8 7 7 8 9 9 10) 7 , 乙 的 射 靶 环 数 从 小 到 大 排 列 为, 乙 的 射 靶 环 数 从 小 到 大 排 列 为 2,4,6,7,7,8,8,9,9,10,所以中位数是,所以中位数是 78 2 7.5;甲的射靶环数从小到大排列为;甲的射靶环数从小
22、到大排列为 5,6,6,7,7,7,7,8,8,9,所以中位数为,所以中位数为 7.于是填充后的表格如表所示:于是填充后的表格如表所示: 平均数平均数 方差方差 中位数中位数 命中命中 9 环及以上环及以上 甲甲 7 1.2 7 1 乙乙 7 5.4 7.5 3 (2)甲、乙的平均数相同,均为甲、乙的平均数相同,均为 7,但,但 s2 甲甲s2乙乙,说明甲偏离平均数的程度小,说明甲偏离平均数的程度小, 而乙偏离平均数的程度大而乙偏离平均数的程度大 甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶环数的优秀次甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶环数的优秀次 数比数比甲多甲多
23、甲、 乙的平均水平相同, 而乙命中甲、 乙的平均水平相同, 而乙命中 9 环以上环以上(包含包含 9 环环)的次数比甲多的次数比甲多 2 次,次, 可知乙的射靶成绩比甲好可知乙的射靶成绩比甲好 从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大, 说明乙的状态在提升,更有潜力说明乙的状态在提升,更有潜力 3市体校准备挑选一名跳高运动员参加全市中学生运动会市体校准备挑选一名跳高运动员参加全市中学生运动会,对跳高运动队对跳高运动队 的甲的甲、乙两名运动员进行了乙两名运动员进行了 8 次选拔比赛次选拔比赛他们的成绩他们的成绩
24、(单位单位:m)如下如下: 甲甲:1.70 1.65 1.68 1.69 1.72 1.73 1.68 1.67 乙乙:1.60 1.73 1.72 1.61 1.62 1.71 1.70 1.75 (1)甲甲、乙两名运动员的跳高平均成绩分别是多少乙两名运动员的跳高平均成绩分别是多少? (2)哪位运动员的成绩更为稳定哪位运动员的成绩更为稳定? (3)若预测跳过若预测跳过 1.65 m 就很可能获得冠军就很可能获得冠军,该校为了获得冠军该校为了获得冠军,可能选哪位可能选哪位 运动员参赛运动员参赛?若预测跳过若预测跳过 1.70 m 才能得冠军呢才能得冠军呢? 解析:解析: (1)x甲 甲1.69
25、(m),x乙乙1.68(m) (2)s2 甲甲0.000 6,s2乙乙0.003 15, 因为因为 s2 甲甲x乙乙,s2甲甲s2乙乙. 不管是跳过不管是跳过 1.65 m,还是跳过,还是跳过 1.70 m 拿冠军,都选甲拿冠军,都选甲 回归方程的应用回归方程的应用 除了函数关系这种确定性的关系外除了函数关系这种确定性的关系外, 还有大量因变量的取值带有一定随机性还有大量因变量的取值带有一定随机性 的两个变量之间的关系的两个变量之间的关系相关关系相关关系 分析两个变量的相关关系时分析两个变量的相关关系时, 我们可根据样本数据散点图确定两个变量之间我们可根据样本数据散点图确定两个变量之间 是否存
26、在相关关系是否存在相关关系, 如果线性相关利用最小二乘法求出回归直线方程如果线性相关利用最小二乘法求出回归直线方程 具体地说具体地说 就是把样本数据表示的点在直角坐标系中作出就是把样本数据表示的点在直角坐标系中作出,叫散点图叫散点图从散点图上从散点图上,我们可我们可 以分析出两个变量是否存在相关关系以分析出两个变量是否存在相关关系 如果这些点大致分布在通过散点图中心的如果这些点大致分布在通过散点图中心的 一条直线附近一条直线附近, 那么就说这两个变量之间具有线性相关关系那么就说这两个变量之间具有线性相关关系, 这条直线叫做回归这条直线叫做回归 直线直线,直线方程叫做回归方程直线方程叫做回归方程
27、 在某种产品表面进行腐蚀刻线试验在某种产品表面进行腐蚀刻线试验,得到腐蚀深度得到腐蚀深度 y(单位单位:m)与腐与腐 蚀时间蚀时间 x(单位单位:s)之间相应的一组观察值如下表之间相应的一组观察值如下表: 腐蚀时间腐蚀时间 x 5 10 15 20 30 40 50 60 70 90 120 腐蚀深度腐蚀深度 y 6 10 10 13 16 17 19 23 25 29 46 (1)画出散点图画出散点图; (2)从散点图中发现腐蚀深度与腐蚀时间之间关系的一般规律从散点图中发现腐蚀深度与腐蚀时间之间关系的一般规律; (3)求回归方程求回归方程; (4)估计腐蚀时间为估计腐蚀时间为 100 s 时
28、腐蚀深度时腐蚀深度 解析:解析: (1)散点图如图所示散点图如图所示 (2)由图可知,各点散布在从左下角到右上角的区域里,因此,腐蚀深度与由图可知,各点散布在从左下角到右上角的区域里,因此,腐蚀深度与 腐蚀时间腐蚀时间之间成正相关,即腐蚀时间越长,腐蚀深度越深之间成正相关,即腐蚀时间越长,腐蚀深度越深 (3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,两变量从散点图可以看出,这些点大致分布在一条直线的附近,因此,两变量 呈线性相关关系呈线性相关关系利用计算器求得回归方程为利用计算器求得回归方程为y 0.304x5.344. (4)由由(3)知知,当腐蚀时间为当腐蚀时间为 100 s
29、 时时,y 0.3041005.34435.744(m), 即此时腐蚀深度约是即此时腐蚀深度约是 35.744 m. 4考古学家通过始祖鸟化石标本发现考古学家通过始祖鸟化石标本发现:其股骨长度其股骨长度 x(cm)与肱骨长度与肱骨长度 y(cm) 的线性回归方程为的线性回归方程为y 1.197x3.660,由此估计由此估计,当股骨长度为当股骨长度为 50 cm 时时,肱骨肱骨 长度的估计值为长度的估计值为_cm. 解析:解析: 根据回归方程根据回归方程y 1.197x3.660,将将 x50 代入得代入得 y56.19,则肱则肱 骨长度的估计值为骨长度的估计值为 56.19 cm. 答案:答案
30、: 56.19 1下列说法不正确的是下列说法不正确的是( ) A方差是标准差的平方方差是标准差的平方 B标准差的大小不会超过极差标准差的大小不会超过极差 C若一组数若一组数据的值大小相等据的值大小相等,没有波动变化没有波动变化,则标准差为则标准差为 0 D 标准差越大标准差越大, 表明各个样本数据在样本平均数周围越集中表明各个样本数据在样本平均数周围越集中; 标准差越小标准差越小, 表明各个样本数据在样本平均数周围越分散表明各个样本数据在样本平均数周围越分散 解析:解析: 标准差越小,表明各个样本数据在样本平均数周围越集中;标准差标准差越小,表明各个样本数据在样本平均数周围越集中;标准差 越大
31、,表明各个样本数据在样本平均数的周围越分散越大,表明各个样本数据在样本平均数的周围越分散故选故选 D. 答案:答案: D 2为了解电视对生活的影响为了解电视对生活的影响,一个社会调查机构就平均每天看电视的时间一个社会调查机构就平均每天看电视的时间 调查了某地调查了某地 10 000 位居民位居民,并根据所得数据画出样本的频率分布直方图并根据所得数据画出样本的频率分布直方图,为了为了 分析该地居民平均每天看电视的时间与年龄分析该地居民平均每天看电视的时间与年龄、学历学历、职业等方面的关系职业等方面的关系,要从要从 这这 10 000 位位居民中再用分层抽样抽出居民中再用分层抽样抽出 100 位居
32、民做进一步调查位居民做进一步调查,则在则在2.5,3)(小小 时时)时间段内应抽出的人数是时间段内应抽出的人数是( ) A25 B30 C50 D75 解析:解析: 抽出的抽出的 100 位居民中平均每天看电视的时间在位居民中平均每天看电视的时间在2.5,3)(小时小时)时间内时间内 的频率为的频率为 0.50.50.25,所以这,所以这 10 000 位居民中平均每天看电视的时间在位居民中平均每天看电视的时间在 2.5,3)(小时小时)时间内的人数是时间内的人数是 10 0000.252500,抽样比是,抽样比是 100 10 000 1 100,则在 ,则在 2.5,3)(小时小时)时间段
33、内应抽出的人数是时间段内应抽出的人数是 2 500 1 100 25.故选故选 A. 答案:答案: A 3.如图是如图是 2015 年元旦晚会举办的挑战主持人大赛上年元旦晚会举办的挑战主持人大赛上,七位评委为某选手打七位评委为某选手打 出的分数的茎叶统计图出的分数的茎叶统计图, 去掉一个最高分和一个最低分后去掉一个最高分和一个最低分后, 所剩数据的平均数和所剩数据的平均数和 方差分别为方差分别为( ) A84,4.84 B84,1.6 C85,1.6 D85,4 解析:解析: 去掉一个最高分去掉一个最高分 93,去掉一个最低分,去掉一个最低分 79,平均数为,平均数为1 5 (8484 868
34、487)85,方差为,方差为1 5(85 84)2(8584)2(8586)2(8584)2(85 87)21.6,因此选,因此选 C. 答案:答案: C 4 下表是降耗技术改造后生产甲产品过程中记录的产量下表是降耗技术改造后生产甲产品过程中记录的产量 x(吨吨)与相应的生产与相应的生产 能耗能耗 y(吨标准煤吨标准煤)的几组对应数据的几组对应数据,根据表中提供的数据根据表中提供的数据,求出求出 y 关于关于 x 的线性的线性 回归方程回归方程y 0.7x0.35,那么表中那么表中 m 的值为的值为( ) x 3 4 5 6 y 2.5 m 4 4.5 A.4 B3.15 C4.5 D3 解析
35、:解析: 由回归方程由回归方程y 0.7x0.35 代入代入 x4 得得y 3.15,m3.15. 答案:答案: B 5抽样统计甲抽样统计甲、乙两位射击运动员的乙两位射击运动员的 5 次训练成绩次训练成绩(单位单位:环环),结果如下结果如下: 运动员运动员 第第 1 次次 第第 2 次次 第第 3 次次 第第 4 次次 第第 5 次次 甲甲 87 91 90 89 93 乙乙 89 90 91 88 92 则成绩较为稳定则成绩较为稳定(方差较小方差较小)的那位运动员成绩的方差为的那位运动员成绩的方差为_ 解析:解析: 分别计算甲、乙两运动员射击环数的平均数分别计算甲、乙两运动员射击环数的平均数
36、和方差并比较,然后得和方差并比较,然后得 出结论出结论 由表中数据计算可得由表中数据计算可得x甲 甲90,x乙乙90,且,且 s2 甲甲1 5(87 90)2(9190)2(9090)2(8990)2(9390)24, s2 乙乙1 5(89 90)2(9090)2(9190)2(8890)2(9290)22. 由于由于 s2 甲甲s2乙乙,故乙的成绩较为稳定,其方差为故乙的成绩较为稳定,其方差为 2. 答案:答案: 2 6 某商店统计了最近某商店统计了最近 6 个月某商品的进价个月某商品的进价 x 与售价与售价 y(单位单位:元元)的对应数据的对应数据 如下如下: x 3 5 2 8 9 1
37、2 y 4 6 3 9 12 14 则则x_,y_, i1 6 x2 i _, i1 6 xiyi_,回归回归 直线方程为直线方程为_ 解析:解析: 根据公式代入即可根据公式代入即可求得,也可利用计算器求解求得,也可利用计算器求解 答案:答案: 6.5 8 327 396 y 8 7x 4 7 7某高级中学共有学生某高级中学共有学生 3 000 名名,各年级男各年级男、女生人数如下表女生人数如下表: 高一年级高一年级 高二年级高二年级 高三年级高三年级 女生女生 487 x y 男生男生 513 560 z 已知在全校学生中随机抽取已知在全校学生中随机抽取 1 名名,抽到高二年级女生的可能性是
38、抽到高二年级女生的可能性是 0.18. (1)高二年级有多少名女生高二年级有多少名女生? (2)现对各年级用分层抽样的方法在全校抽取现对各年级用分层抽样的方法在全校抽取 300 名学生名学生, 应在高三年级抽取应在高三年级抽取 多少名学生多少名学生? 解析:解析: (1)由由 x 3 000 0.18 得得 x540,所以高二年级有,所以高二年级有 540 名女生名女生 (2)高三年级人数为高三年级人数为 yz3 000(487513540560)900, 900 3 000 30090,故应在高三年级抽取,故应在高三年级抽取 90 名学生名学生 8下面是水稻产量与施化肥量的一组观测数据下面是
39、水稻产量与施化肥量的一组观测数据: 施化肥量施化肥量(kg) 15 20 25 30 35 40 45 水稻产量水稻产量(kg) 320 330 360 410 460 470 480 (1)将上述数据制成散点图将上述数据制成散点图; (2)你能从散点图中发现施化肥量与水稻你能从散点图中发现施化肥量与水稻产量近似成什么关系吗产量近似成什么关系吗?水稻产量会水稻产量会 一直随施化肥量的增加而增长吗一直随施化肥量的增加而增长吗? 解析:解析: (1)散点图如下:散点图如下: (2)从图中可以发现施化肥量与水稻产量具有线性相关关系, 当施化肥量由小从图中可以发现施化肥量与水稻产量具有线性相关关系, 当施化肥量由小 到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因 此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着 化肥施用量的增加而增长化肥施用量的增加而增长 谢谢观看!谢谢观看!