1、2/11/20231选修选修1-2(一)(一)2/11/20232回顾:回顾:必修必修3(3(第二章第二章 统计统计)知识结构知识结构 收集数据收集数据 (随机抽样随机抽样)整理、分析数据整理、分析数据估计、推断估计、推断简单随机抽简单随机抽样样分层抽样分层抽样系统抽样系统抽样用样本估计总体用样本估计总体变量间的相关关系变量间的相关关系 用样本用样本的频率的频率分布估分布估计总体计总体分布分布 用样本用样本数字特数字特征估计征估计总体数总体数字特征字特征线性回归分析线性回归分析2/11/202331、两个变量的关系、两个变量的关系不相关不相关相关相关关系关系函数关系函数关系线性相关线性相关非线
2、性相关非线性相关问题问题1:现实生活中两个变量间的关系有哪些?:现实生活中两个变量间的关系有哪些?相关关系:相关关系:对于两个变量,当自变量取值一定对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量时,因变量的取值带有一定随机性的两个变量之间的关系。之间的关系。2/11/20234思考:相关关系与函数关系有怎样的不同?函数关系中的两个变量间是一种确定性关系.相关关系是一种非确定性关系.函数关系是一种理想的关系模型.相关关系在现实生活中大量存在,是更一般的情况.2/11/20235问题问题2:对于线性相关的两个变量用什么方法:对于线性相关的两个变量用什么方法来刻划之间的关系呢
3、?来刻划之间的关系呢?2、最小二乘估计、最小二乘估计最小二乘估计下的线性回归方程:最小二乘估计下的线性回归方程:ybxa121()()()niiiniixXyYbXX aYbX2/11/20236 对一作直线运动的质点的运动过程作了8次观测,得到下表,试估计当x=9s时质点的位置y的值。时刻时刻x/s12345678位置观位置观测值测值y/cm5.547.5210.0211.7315.6916.1216.9821.06例如:例如:2/11/20237解解:(:(1)作出散点图作出散点图从散点图看出,样本呈从散点图看出,样本呈直线趋势直线趋势,时间,时间x与位置与位置观测值观测值y有较好的有较好
4、的线性关系线性关系,可以用,可以用线性回归方线性回归方程程刻画它们之间的关系刻画它们之间的关系.2/11/20238ixiyixi2xiyi115.5415.54227.52415.043310.02930.064411.731646.925515.692578.456616.123696.727716.9849118.98821.0664168.536104.66204560.1(2)列表列表08.1350.4nyynxxii其中:2/11/20239(3)求线性回归方程求线性回归方程:y=3.5361+2.1214x2/11/2023103、回归分析的基本步骤回归分析的基本步骤:画散点图画
5、散点图求回归方程求回归方程列表列表2/11/202311数学必修统计画出散点图画出散点图.求出求出b,a的值的值.求回归直线方程求回归直线方程.1.用线性回归方程解决应用问题用线性回归方程解决应用问题.2/11/2023124、线性回归模型线性回归模型yabx其中其中a+bx是确定性函数,是确定性函数,是随机误差是随机误差注:注:随机误差随机误差 产生的主要原因:产生的主要原因:(1)所用的确定性函数不恰当;所用的确定性函数不恰当;(2)忽略了某些因素的影响;忽略了某些因素的影响;(3)存在观测误差。存在观测误差。思考:在时刻x=9s时,质点运动位置一定是22.6287cm吗?2/11/202
6、313对于线性回归模型对于线性回归模型应注意以下两个问题:应注意以下两个问题:I 模型的合理性;模型的合理性;II 在模型合理的情况下,如何估计在模型合理的情况下,如何估计a,b.yabx2/11/202314例例1.下表给出我国从下表给出我国从1949至至1999年人口数年人口数据资料,试根据表中数据估计我国据资料,试根据表中数据估计我国2004年年的人口数。的人口数。年份年份4954596469747984899499人口数人口数/百万百万5426036727058079099751035110711771246年份年份05101520253035404550人口数人口数/百万百万5426
7、03672705807909975 1035110711771246分析:先画图2/11/202315解:作出散点图解:作出散点图从散点图看出,这些点在一条直线附近,可以从散点图看出,这些点在一条直线附近,可以用用线性回归方程线性回归方程刻画它们之间的关系刻画它们之间的关系.2/11/202316ixiyixi2xiyi10542002560325301531067210067204157052255208074006259096257309759008351035122594011071600104511772025115012462500列表列表2/11/202317根据公式得:vb=14
8、.453va=527.591v线性回归方程为:vy=527.591+14.453xv当x=55 时,y=1322.506(百万)2/11/202318例题例题2.一个车间为了规定工时定额,需要确定一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了加工零件所花费的时间,为此进行了10次试验,次试验,测得数据如下:测得数据如下:零件数零件数(x)个个102030405060708090100加工加工时间时间y626875818995102108115 122(1)y与与x是否具有线性相关?是否具有线性相关?(2)若若y与与x具有线性相关关系,求回归直线方程具有线性相关关系,求回归直
9、线方程(3)预测加工预测加工200个零件需花费多少时间?个零件需花费多少时间?2/11/202319分析:这是一个回归分析问题,应先进行分析:这是一个回归分析问题,应先进行线性相关检验或作散点图来判断线性相关检验或作散点图来判断x与与y是否是否具有线性相关才可以求解后面的问题。具有线性相关才可以求解后面的问题。作散点图如下:作散点图如下:不难看出不难看出x,y成线性相关。成线性相关。2/11/202320解解(1)列出下表:)列出下表:i12345678910 xi102030405060708090100yi626875818995102108115122xiyi620136022503240445057007140864010350122002/11/202321问题:有时散点图的各点并不集中在一条直线的附近,仍然可以按照求回归直线方程的步骤求回归直线,显然这样的回归直线没有实际意义。在怎样的情况下求得的回归直线方程才有实际意义?即建立的线性回归模型是否合理?如何对一组数据之间的线性相关程度作出定量分析?