1、曲线拟合主要内容主要内容 背景及应用背景及应用1 在故障诊断中的应用在故障诊断中的应用3 基本原理及实现方法基本原理及实现方法2 总结及展望总结及展望4 参考文献参考文献51 1、背景及应用、背景及应用理论上,可以根据插值原则构造n次多项式Pn(x),使其正好通过实测点。实际情况,为尽量反应真实情况,需要数目很多的采样点。这样,会造成插值多项式次数很高,增大计算量,影响函数逼近程度。并且差值多项式需要经过每一个测试点,这样会保留测量误差,影响函数逼近精度。在许多领域中,常常需要根据实际测试所得到的一系列数据,求出变量间的函数关系。因此,我们一般根据已知实际测试样点,找出被测试量之间的函数关系,
2、使得找出的近似函数曲线能够充分反映实际测试量之间的关系,这就是曲线拟合曲线拟合。1 1、背景及应用、背景及应用 由于通过曲线拟合方法能将实际试验测试数据转化成合乎误差要求的近似曲线、函数解析式,它被广泛应用于图像处理、逆向工程、计算机辅助设计,以及测试数据的处理分析等领域。2 2、基本原理及实现方法、基本原理及实现方法2.1 曲线拟合的定义曲线拟合的定义曲线拟合,是指求取一个函数解析式曲线拟合,是指求取一个函数解析式 y=f(x,cy=f(x,c),使其通过或,使其通过或者近似通过有限的试验数据对者近似通过有限的试验数据对(x(xi i,y,yi i)(i)(i=1,2,n)=1,2,n),从
3、而,从而实现用拟合曲线方程来分析变量之间的关系。实现用拟合曲线方程来分析变量之间的关系。其中,其中,c=(cc=(c0 0,c,c1 1,c,cm m),),为曲线方程的待定参数。为曲线方程的待定参数。2 2、基本原理及实现方法、基本原理及实现方法2.2 曲线拟合的方法曲线拟合的方法 实现曲线拟合的方法有很多,在实际应用中需要针对不同的问题实现曲线拟合的方法有很多,在实际应用中需要针对不同的问题采取不同的方法。采取不同的方法。有理论模型的曲线拟合有理论模型的曲线拟合无理论模型的曲线拟合无理论模型的曲线拟合有一定的背景资料、规律性有一定的背景资料、规律性强,只需要找出与背景资料强,只需要找出与背
4、景资料相适应的曲线方程。相适应的曲线方程。最常用的是最常用的是最小二乘法最小二乘法。曲曲线线拟拟合合问问题题规律性差、理论模型难以建规律性差、理论模型难以建立或不需要理论模型。立或不需要理论模型。这类问题一般采用这类问题一般采用几何方法几何方法或者或者神经网络法神经网络法实现曲线拟实现曲线拟合。合。2 2、基本原理及实现方法、基本原理及实现方法2.2 曲线拟合的方法曲线拟合的方法最小二乘法最小二乘法已知试验数据点(已知试验数据点(x xi i.y.yi i)(i=1,2,n),(i=1,2,n),假设实验数据点可以用线性模型假设实验数据点可以用线性模型拟合,解析式为:拟合,解析式为:y=y=0
5、 0+1 1x+x+(1)(1)其中其中,0 0,1 1是待求参数,误差是待求参数,误差服从服从N(1,N(1,2 2)将将n n个实验点分别带入表达式(个实验点分别带入表达式(1 1)得到)得到:y yi i=0 0+1 1x xi i+i i 根据最小二乘原理,拟合得到的参数应使曲线与试验点之间的误差的平方根据最小二乘原理,拟合得到的参数应使曲线与试验点之间的误差的平方和达到最小,也就是使如下的目标函数达到最小:和达到最小,也就是使如下的目标函数达到最小:2 2、基本原理及实现方法、基本原理及实现方法2.2 曲线拟合的方法曲线拟合的方法最小二乘法最小二乘法将试验点数据点入之后,求目标函数的
6、最值问题就变成了求取使目将试验点数据点入之后,求目标函数的最值问题就变成了求取使目标函数对待求参数的偏导数为零时的参数值问题,即:标函数对待求参数的偏导数为零时的参数值问题,即:求解方程组,就能唯一地确定待求参数求解方程组,就能唯一地确定待求参数0 0,1 1的值,从而实现了的值,从而实现了曲线的最小二乘拟合。曲线的最小二乘拟合。2 2、基本原理及实现方法、基本原理及实现方法2.2 曲线拟合的方法曲线拟合的方法最小二乘法最小二乘法对于非线性模型,有的可以通过适当的数学变换将其线性化,然对于非线性模型,有的可以通过适当的数学变换将其线性化,然后采用最小二乘法进行拟合。常用的可以线性化的模型如下表
7、所后采用最小二乘法进行拟合。常用的可以线性化的模型如下表所示:示:实际问题中,通过一组观测数据,找出描述这些数据的规律,即构造一条拟合曲线,反映所给数据点总的趋势,以消除所给数据的局部误差。问题特点(xi,yi),i=1,2,N,N很大 yi本身为测量值,不准确拟合函数f(x)没有必要完全通过,所给的空间点,只需要ei=f(xi)-yi(残差)总体上尽可能的小 构造拟合曲线的准则2123()max|min()|min()miniiiiiieee使使残残差差的的绝绝对对值值为为最最小小 使使残残差差的的绝绝对对值值之之和和为为最最小小 使使残残差差的的平平方方和和为为最最小小 基于准则基于准则3
8、 3来选取拟合曲线的方法,称为来选取拟合曲线的方法,称为曲线拟合的曲线拟合的最小二乘法最小二乘法一.直线拟合21101 2.(,)(,),()iiNiiix yiNya bxQya bx 问问题题对对于于给给定定的的数数据据点点求求作作一一次次式式使使得得总总误误差差为为最最小小00,QQQab解解:使使 达达到到极极值值的的参参数数a a,b b满满足足112111NNiiiiNNNiiiiiiiaNbxyaxbxx y有有求解二元一次方程,得到取定拟合直线的参数求解二元一次方程,得到取定拟合直线的参数a,b实例:考察某种纤维的强度与其拉伸倍数的关系实例:考察某种纤维的强度与其拉伸倍数的关系
9、,下下表是实际测定的表是实际测定的2424个纤维样品的强度与相应的拉伸倍个纤维样品的强度与相应的拉伸倍数是记录数是记录:iiyxiiyx纤维强度随拉伸纤维强度随拉伸倍数增加而增加倍数增加而增加12345678910123456789并且并且24个点大致分个点大致分布在一条直线附近布在一条直线附近系要关系应是线性关的主与拉伸倍数因此可以认为强度xy()y xabx1234567891012345678924127 5131 1127 5829 61731 6.abab解得:解得:a=0.1505,b=0.85870 15050 8587().f xx即即为为拟拟合合直直线线二.多项式拟合若所给的
10、数据点用直线拟合不合适,可若所给的数据点用直线拟合不合适,可以考虑用多以考虑用多项式拟拟合项式拟拟合0210111 2.(,)(,),iimjjjNmjijiijx yiNya xQya x问问题题对对于于给给定定的的数数据据点点求求作作m m(m m N N)次次多多项项式式使使得得总总误误差差为为最最小小01001(,),jkQa jmQkma解解:可可以以看看作作是是关关于于的的多多元元函函数数,因因此此拟拟合合多多项项式式的的构构造造转转化化为为多多元元函函数数的的极极值值问问题题,令令10200 1,Nmjkijiiijya xxkm1010 1,NmNj kkjiiiijia xy
11、 xkm0121011201mimiiimiimiiimmmmiimiiia Naxaxyaxaxaxy xaxaxaxy x因此有,因此有,ja关关于于系系数数 的的线线性性方方程程组组正则方程组正则方程组上方程组解是否存在唯一?上方程组解是否存在唯一?定理定理7 7 正则方程组有唯一解正则方程组有唯一解 定定理理8 80mjjjya x则则必必为为问问题题1111的的解解ja设设(j=0,1,m)(j=0,1,m)是是正正则则方方程程组组的的解解,利用正则方程组求解曲线拟合问题是一个古老的方法,利用正则方程组求解曲线拟合问题是一个古老的方法,在实际计算中,当在实际计算中,当m较大时,正则方
12、程组往往是病态较大时,正则方程组往往是病态的,其求解方法有待于进一步改进的,其求解方法有待于进一步改进证明:即对应的齐次方程组证明:即对应的齐次方程组只有零解。只有零解。100Nmj kjiija x三.观察数据的修匀 提高拟合多项式的次数不一定能改善提高拟合多项式的次数不一定能改善逼近效果,实际计算时常用不同的低逼近效果,实际计算时常用不同的低次多项式去拟合不同的分段次多项式去拟合不同的分段-分段分段拟合拟合设已给一批实测数据设已给一批实测数据(xi,yi)(i=1,2,N),由于测,由于测量方法和实验环境的影响,不可避免地会产生随机量方法和实验环境的影响,不可避免地会产生随机干扰和误差,希
13、望根据数据的分布的总的趋势去剔干扰和误差,希望根据数据的分布的总的趋势去剔除观察数据中的偶然误差除观察数据中的偶然误差-数据修匀数据修匀(数据平滑数据平滑)问题问题21012000521 0 1 2,()/(,),iixxxxxxxxxht txxhi it 相相邻邻的的 个个节节点点设设节节点点之之间间是是等等距距的的,记记节节点点间间距距为为h h,作作变变换换t=()/ht=()/h,即即现现考考虑虑对对变变量量 进进行行讨讨论论ti-2-1012yiy-2y-1y0y1y22yabtct设设用用二二项项式式作作拟拟合合2222222510101034iiiiiiacybiyaci y则
14、则正正则则方方程程组组为为021012013121712335()xyyyyyy则则在在节节点点处处(t=0)(t=0)的的为为五五点点二二次次修修匀匀公公式式211221012210121221012221413121712335()()()byyyycyyyyyayyyyy解得:00()yy xa注:注:三次样条与分段三次样条与分段 Hermite Hermite 插值的根本区别插值的根本区别在于在于S S(x x)自身光滑自身光滑,不需要知道,不需要知道 f f 的导数值的导数值(除了在(除了在2 2个端点可能需要);而个端点可能需要);而HermiteHermite插值依插值依赖于赖于f f 在所有插值点的导数值。在所有插值点的导数值。f(x)H(x)S(x)