1、=【 ;精品教育资源文库 】 = 第 3 讲 变量相关关系与统计案例 板块一 知识梳理 自主学习 必备知识 考点 1 变量间的相关关系 1常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系 2从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关 考点 2 回归方程与回归分析 1线性相关关系与回归直线 如果散点图中点的分布从整体上看大致在 一条直线 附近,就称这两个变量之间具有线性相关关系,这 条直线叫做回归直线 2回归方程 (1)最小二乘法:求回归直线
2、使得样本数据的点到回归直线的 距离的平方和 最小的方法叫做最小二乘法 (2)回归方程:方程 y bx a是两个具有线性相关关系的变量的一组数据 (x1, y1), (x2,y2), ? , (xn, yn)的回归方程,其中 a, b是待定数 ? b ?i 1n?xi x ?yi y ?i 1n?xi x ?2?i 1nxiyi n x y?i 1nx2i n x 2,a y b x .3回归分析 (1)定义:对具有 相关关系 的两 个变量进行统计分析的一种常用方法 (2)样本点的中心:在具有线性相关关系的数据 (x1, y1), (x2, y2), ? , (xn, yn)中, x 1n(x1
3、 ? xn), y 1n(y1 ? yn), a y b x , ( x , y )称为样本点的中心 =【 ;精品教育资源文库 】 = (3)相关系数 r?i 1n?xi x ?yi y ?i 1n?xi x ?2?i 1n?yi y ?2,当 r0 时,两变量 正 相关,当 r10.828 就有 99.9%的理由认为两个量是有关的 板块二 典例探究 考向突破 考向 线性回归分析 例 1 2018 金华模拟 某百货公司 1 6 月份的销售量 x 与利润 y 的统计数据如下表: 月份 1 2 3 4 5 6 销售量 x(万件 ) 10 11 13 12 8 6 利润 y(万元 ) 22 25 2
4、9 26 16 12 (1)根据 2 至 5 月份的数据,求出 y 关于 x 的回归直线方程 y bx a; (2)若由回归直线方程得到的估计数据与剩下的检验数据的误差均不超过 2 万元,则认为得到的回归直线方程是理想的,试问所得回归直线方程是否理想? 参考公式: bni 1xiyi nx yni 1x2i nx 2 , a y bx . 解 (1)根据表中 2 至 5 月份的数据, 计算得 x 11, y 24, 5i 2xiyi 1125 1329 1226 816 1092, 5i 2x2i 112 132 122 82 498, 则 b5i 2xiyi 4x y5i 2x2i 4x 2
5、 1092 41124498 411 2 187 , =【 ;精品教育资源文库 】 = a y bx 24 187 11 307. 故 y 关于 x 的回归直线方程为 y 187x 307. (2)当 x 10 时, y 187 10 307 1507 , 此时 ? ?1507 22 6.635,故有 99%的把握认为箱产量与养殖方法有关 (3)因为新养 殖法的箱产量频率分布直方图中,箱产量低于 50 kg 的直方图面积为 (0.004 0.020 0.044)5 0.340.5, 故新养殖法产量的中位数的估计值为 50 0.5 0.340.068 52.35(kg) 触类旁通 利用统计量 K
6、2进行独立性检验的步骤 =【 ;精品教育资源文库 】 = (1)根据数据列出 22 列联表; (2)根据公式计算 K2找观测值 k; (3)比较观测值 k 与临界值表中相应的检验水平 ,作出统计推断 【变式训练 2】 某校在高一年级学生中,对自然科学类、社会科学类校本选修课程的选课意向进行调查现从高一年级学生中随机抽取 180 名学生,其中男生 105 名;在这 180名学生中选择社会科学类的男生、女生均为 45 名 (1)试问:从高一年级学生中随机抽取 1 人,抽到男生的概率约为多少? (2)根据抽取的 180 名学生的调查结果,完成下面 22 列联表并判断能否在犯错误的概率不超过 0.02
7、5 的前提下认为科类的选择与性别有关? 选择自然科学类 选择社会科学类 合计 男生 女生 合计 附: K2 n?ad bc?2?a b?c d?a c?b d?,其中 n a b c d. P(K2k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 解 (1)从高一年级学生中随机抽取 1 人,抽到男生的概率约为 105180 712. (2)根据 统计数据,可得 22 列联表如下: 选择自然科学类 选择社会科学类 合计 男生 60 45 105 女生 30 45 75 合计 90 90 180 K2 180 ?6045 3045 ?2105759090 367 5.14295.024. 在犯错误的概率不超过 0.025 的前提下可以认为科类的选择与性别有关