1、1数学必修数学必修3 3统计统计1.画散点图画散点图2.了解最小二乘法了解最小二乘法的思想的思想3.求近似直线方程求近似直线方程ya+bx4.用近似直线方程用近似直线方程解决应用问题解决应用问题选修选修1-21-2回归分析回归分析5.引入线性回归模型引入线性回归模型y=a+bx6.总结了回归分析思想总结了回归分析思想7.引入了相关系数反映引入了相关系数反映二个相关变量的相差二个相关变量的相差程度程度8.利用线性回归直线模利用线性回归直线模型解决实际应用问题型解决实际应用问题1、两个变量的关系、两个变量的关系不相关不相关相关相关关系关系函数关系函数关系线性相关线性相关?问题问题1:现实生活中两个
2、变量间的关系有哪些?:现实生活中两个变量间的关系有哪些?相关关系:相关关系:对于两个变量,当自变量取值一定对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量时,因变量的取值带有一定随机性的两个变量之间的关系。之间的关系。思考:相关关系与函数关系有怎样的不同?函数关系中的两个变量间是一种确定性关系.相关关系是一种非确定性关系.函数关系是一种理想的关系模型.相关关系在现实生活中大量存在,是更一般的情况.求线性回归直线方程有哪几个量?求线性回归直线方程有哪几个量?xxlyylxylxxxyllb yyxxxylllr xbya 例题例题1.一个车间为了规定工时定额,需要确定一个车
3、间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了加工零件所花费的时间,为此进行了10次试验,次试验,测得数据如下:测得数据如下:(1)y与与x是否具有线性相关?是否具有线性相关?(2)若若y与与x具有线性相关关系,求回归直线方程具有线性相关关系,求回归直线方程(3)预测加工预测加工200个零件需花费多少时间?个零件需花费多少时间?案例案例2 一只红铃虫的产卵数一只红铃虫的产卵数y和温度和温度x有关。现有关。现收集了收集了7组观测数据列于表中:组观测数据列于表中:(1 1)试建立产卵数)试建立产卵数y y与温度与温度x x之间的回归方程;并之间的回归方程;并预测温度为预测温度为282
4、8o oC C时产卵数目。时产卵数目。(2 2)你所建立的模型中温度在多大程度上解释了)你所建立的模型中温度在多大程度上解释了产卵数的变化?产卵数的变化?温度温度xoC21232527293235产卵数产卵数y/个个711212466115325引入新授问题引入新授问题假设线性回归方程为假设线性回归方程为:=bx+a选选 模模 型型由计算器得:线性回归方程为由计算器得:线性回归方程为y=y=19.8719.87x x-463.73-463.73 相关系数相关系数R R2 2=r r2 20.8640.8642 2=0.7464=0.7464估计参数估计参数 解:选取气温为解释变量解:选取气温为
5、解释变量x x,产卵数,产卵数 为预报变量为预报变量y y。选变量选变量探索新知探索新知画散点图画散点图050100150200250300350036912151821242730333639方案1分析和预测分析和预测当当x=28时,时,y=19.8728-463.73 93一元线性模型一元线性模型奇怪?奇怪?9366?模型不好?模型不好?y=bx2+a 变换变换 y=bt+a非线性关系非线性关系 线性关系线性关系方案2问题问题选用选用y=bx2+a,还是,还是y=bx2+cx+a?问题问题3 产卵数产卵数气温气温问题问题2如何求如何求a、b?合作探究合作探究 t=x2二次函数模型二次函数模
6、型方案2解答平方变换平方变换:令令t=xt=x2 2,产卵数,产卵数y y和温度和温度x x之间二次函数模型之间二次函数模型y=bxy=bx2 2+a+a就转化为产卵数就转化为产卵数y y和温度的平方和温度的平方t t之间线性回归模型之间线性回归模型y=bt+ay=bt+a温度温度21232527293235温度的平方温度的平方t44152962572984110241225产卵数产卵数y/个个711212466115325作散点图,并由计算器得:作散点图,并由计算器得:y y和和t t之间的线性回归方程为之间的线性回归方程为y=y=0.3670.367t t-202.543-202.543,
7、相关指数,相关指数R R2 2=0.802=0.802将将t=xt=x2 2代入线性回归方程得:代入线性回归方程得:y=y=0.3670.367x x2 2-202.543-202.543当当x x=28=28时时,y y=0.367=0.36728282 2-202.5485202.5485,且,且R R2 2=0.802=0.802,所以,二次函数模型中温度解所以,二次函数模型中温度解释了释了80.2%80.2%的产卵数变化。的产卵数变化。t问题问题 变换变换 y=bx+a非线性关系非线性关系 线性关系线性关系21c xyce问题问题如何选取指数函数的底如何选取指数函数的底?产卵数产卵数气
8、温气温指数函数模型指数函数模型方案3合作探究合作探究对数对数方案3解答温度温度xoC21232527293235z=lny1.9462.3983.0453.1784.1904.7455.784产卵数产卵数y/个个711212466115325xz当当x=28x=28o oC C 时,时,y 44 y 44,指数回归,指数回归模型中温度解释了模型中温度解释了98.5%98.5%的产卵数的的产卵数的变化变化由计算器得:由计算器得:z z关于关于x x的线性回归方程的线性回归方程为为0.272x-3.849.ye22111221lnln()lnlnlnlnlnc xc xycececc xec xc
9、 对数变换:在对数变换:在 中两边取常用对数得中两边取常用对数得21c xyce令令 ,则,则 就转换为就转换为z=bx+a.z=bx+a.12ln,ln,zy ac bc21c xyce z=0.272x-3.849,相关系数相关系数R R2 2=0.98=0.98最好的模型是哪个最好的模型是哪个?产卵数产卵数气温气温产卵数产卵数气温气温线性模型线性模型二次函数模型二次函数模型指数函数模型指数函数模型比一比比一比最好的模型是哪个最好的模型是哪个?练习:练习:为了研究某种细菌随时间为了研究某种细菌随时间x x变化,繁殖的个数,变化,繁殖的个数,收集数据如下:收集数据如下:天 数天 数 x/x/
10、天天 1 1 2 2 3 34 4 5 56 6繁殖个数繁殖个数y/y/个个 6 6 1212 2525 4949 9595190190 (1 1)用天数作解释变量,繁殖个数作预报变量,作出这些)用天数作解释变量,繁殖个数作预报变量,作出这些 数据的散点图;数据的散点图;(2)描述解释变量与预报变量描述解释变量与预报变量 之间的关系;之间的关系;(3 3)计算残差、相关指数计算残差、相关指数R R2 2.天数天数繁殖个数繁殖个数解:解:(1)散点图如右所示散点图如右所示 (2 2)由散点图看出样本点分布在一条指数函数)由散点图看出样本点分布在一条指数函数y=y=的的周围,于是令周围,于是令Z=
11、lny,Z=lny,则则2C x1eCx x1 12 23 34 45 56 6Z Z1.791.792.482.483.223.223.893.894.554.555.255.25由计数器算得由计数器算得 则有则有Z=0.69X 1.1120.69x 1.112 y=e y6.066.0612.0912.0924.0924.0948.0448.0495.7795.77190.9190.9y y6 61212252549499595190190n22ii=11e()3.1643,niiiyyn222i1i=1()yny25553.3.niiyy(3)即解释变量天数对预报变量繁殖细菌得个数解释了
12、即解释变量天数对预报变量繁殖细菌得个数解释了99.99%.99.99%.23.164310.9999.25553.3R 练习练习 假设关于某设备的使用年限假设关于某设备的使用年限x和所支出的维修费用和所支出的维修费用 y(万(万元),有如下的统计资料。元),有如下的统计资料。若由资料知若由资料知,y对对x呈线性相关关系。试求:呈线性相关关系。试求:(1)线性回归方程)线性回归方程 的回归系数的回归系数 ;(2)求残差平方和;)求残差平方和;(3)求相关系数)求相关系数 ;(4)估计使用年限为)估计使用年限为10年时,维修费用是多少?年时,维修费用是多少?ybxa ab、2R解:解:(1)由已知数据制成表格。)由已知数据制成表格。ixiyiix y2ix4;5;xy5521190;112.3.iiiiixx yi1.23,0.08.ba1.230.08.yx所以有所以有