1、 高考一轮复习热点难点精讲精析:10.3统计案例 (一)线性回归分析相关链接1.首先利用散点图判断两个变量是否线性相关.2.求回归方程.(1)线性回归方程中的截距和斜率都是通过样本估计而来的,存在着误差,这种误差可能导致预报结果的偏差.(2)回归方程中的表示增加1个单位时的变化量为.(3)可以利用回归方程预报在取某一个值时的估计值.3.相关系数利用相关系数来衡量两个变量之间的线性相关的强弱.4.建立回归模型的步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).(3)由经验确定回归方程的类型
2、(如我们观察到数据呈线性关系,则选用线性回归方程).(4)按一定规则估计回归方程中的参数(如最小二乘法).(5)得出结果后分析残差是否异常(个别数据对应残差过大,或残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否适合等.注:回归方程只适用于我们所研究的样本的总体,而且一般都有时间性.样本的取值范围一般不能超过回归方程的适用范围,否则没有实用价值.例题解析例测得某国10对父子身高(单位:英寸)如下:(1)对变量进行相关性检验;(2)如果之间具有线性相关关系,求回归方程.(3)如果父亲的身高为73英寸,估计儿子的身高.思路解析:(1)先根据已知计算相关系数,判断是否具有相关关
3、系.(2)再利用分工求出回归方程进行回归分析.解答:(1)所以之间具有很强的线性相关关系.(2)设回归方程为.由.故所求的回归方程为:.(3)当x=73时, .所以当父亲身高为73英寸时,估计儿子身高约为69.9英寸.(二)非线性回归分析相关链接1.非线性回归模型:当回归方程不是形如时称之为非线性回归模型.2.非线性回归模型的拟合效果:对于给定的样本点,两个含有未知数的模型,其中都是未知参数.可按如下的步骤比较它们的拟合效果:(1)分别建立对应于两个模型的回归方程,其中分别是参数的估计值;(2)分别计算两个回归方程的残差平方和;(3)若,则;反之, 例题解析例为了研究某种细菌随时间x变化时,繁
4、殖个数y的变化,收集数据如下:(1)用天数x作解释变量,繁殖个数y作预报变量,作出这些数据的散点图 (2)描述解释变量x与预报变量y之间的关系;(3)计算残差平方和、相关指数.思路解析:作出散点图分析与哪种曲线拟合转化线性关系进行回归分析.解答:(1)所作散点图如图所示.(2)由散点图看出样本点分析在一条指数函数的周围,于是令,则由计算器得:则有.(3) 则,=24642.8,即解释变量天数对预报变量细菌的繁殖个数解释了99.99%.(三)独立性检验例在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分别利用图形和独立性检验的方法来判断色盲与性别是否有关?你所得到的结论在什
5、么范围内有效?思路解析:(1)先由已知作出调查数据的列联表;(2)再根据列联表画出二维条形图,并进行分析;(3)利用独立性检验作出判断.解答:根据题目所给的数据作出如下的联表:根据列联表作出相应的二维条形图,如图所示.从二维条形图来看,在男人中患色盲的比例,要比在女人中患色盲的比例要大,其差值为差值较大,因而我们可以认为“性别与患色盲是有关的”,根据列联表中所给的数据可以有代入公式得。由于10.828,所以我们有99.9%的把握认为性别与患色盲有关系.这个结论只对所调查的480名男人和520名女人有效.注:利用图形来判断两个变量之间是否有关系,可以结合所求的数值来进行比较.作图应注意单位统一、图形准确,但它不能给出我们两个分类变量有关或无关的精确的可信程度,若要作出精确的判断,可以作独立性检验的有关计算.5