代数插值与曲线拟合.doc_第1页
代数插值与曲线拟合.doc_第2页
代数插值与曲线拟合.doc_第3页
代数插值与曲线拟合.doc_第4页
代数插值与曲线拟合.doc_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第 五 章 代数插值在生产实践和科学研究所遇到的大量函数中,相当一部分是通过测量或实验得到的。虽然其 函数关系y=f(x)在某个区间a,b上是客观存在的,但是却不知道具体的解析表达式,只能通过观察、测量或实验得到函数在区间a,b上一些离散点上的函数值、导数值等, 因此,希望对这样的函数用一个比较简单的函数表达式来近似地给出整体上的描述。还有些函数,虽然有明确的解析表达式,但却过于复杂而不便于进行理论分析和数值计算,同样希 望构造一个既能反映函数的特性又便于计算的简单函数,近似代替原来的函数。插值法就是寻求近似函数的方法之一。在用插值法寻求近似函数的过程中,根据所讨论问题的特点,对简单函数的类型可有不同的 选取,如多项式、有理式、三角函数等,其中多项式结构简单,并有良好的性质,便于数值计算和理论分析,因此被广泛采用。本章主要介绍多项式插值、分段多项式插值和样条插值.第一节 插值多项式的存在唯一性5.1.1 插值问题设函数y=f(x)在区间a,b上有定义且已知函数在区间a,b上n+1个互异点上的函数值,若存在一个简单函数y=p(x ),使其经过y=f(x)上的 这n+1个已知点(),(),,()(图5-1),即 p()= , i=0,1,n那么,函数p(x)称为插值函数,点称为插节点, 点(),(),,()称为插值点,包含插值节点的区间a,b称为插值区间,求p (x)的方法称为插值法,f(x)称为被插函数。若p(x)是次数不超过n的多项式,用Pn(x)表示,即则称为n次插值多项式,相应的插值法称为多项式插值;若P(x)为分段多项式,称为分段插值,多项式插值和分段插值称为代数插值。5-15.1.2插值多项式的存在唯一性定理 设节点互异,则在次数不超过n的多项式集合中,满足条件(5.1.1)的插值多项式存在且唯一。证 将代入式(1)得这是关于的n+1元线性方程组,其系数行列式V()=是范得蒙(Vandermonde)行列式,故 V()=由于互异,所有因子0(ij),于是V()0再由克莱姆法则,方程组(2)存在唯一的一组解,即满足条件(1) 的插值多项式存在且唯一。第二节 拉格朗日插值多项式5.2.1基函数由上一节的证明可以看到,要求插值多项式,可以通过求方程组(5.1.22)的解得到,但这样不但计算复杂,且难于得到的简单表达式。考虑简单的插值问题:设函数在区间a,b上n1个互异节点上的函数值为 j=0,1,n求插值多项式,满足条件 j=0,1,n, i=0,1,n由上式知,是的根,且,可令再由得于是n+1个n次多项式称为以为节点的n次插值基函数。n=1时的一次基函数为(图5-2):. n=2时的二次基函数为(图5-3):5-25-35.2.2 拉格朗日插值多项式现在考虑一般的插值问题:设函数在区间a,b上n+1个互异节点上的函数值分别为,求n次插值多项式,满足条件 j=0,1,n令 (5.2.3)其中为以为节点的n次插值基函数,则是一次数不超过n的多项式,且满足, j=0,1,n再由插值多项式的唯一性,得式(5.2.3)表示的插值多项式称为拉格朗日(Lagrange)插值多项式。特别地,n=1 时称为线性插值(图5-4(a),n=2时称为抛物插值或二次插值(图5-4(b)。值得注意的是,插值基函数仅由插值节点确定,与被插函数f(x)无关。因此,若以 为插值节点对函数f(x)1作 插值多项式,则由式(5.2.3)立即得到基函数的一个性质1还应注意,对于插值节点,只要求它们互异,与大小次序无关。5-4例1:已知y=,=4,=9,用线性插值求的近似值。解:=2,=3,基函数分别为插值多项式为 所以例2:求过点(-1,-2),(1,0),(3,-6),(4,3)的三次插值多项式。 解:以-1,1,3,4为节点的基函数分别为插值多项式为5.2.3 插值余项插值多项式的余项(x)=f(x)-(x),也就是插值的截断误差或方法误差。关于余项有 如下的余项定理:定理:设被插函数f(x)在闭区间a,b上n阶导数连续,在开区间(a,b)内存在,是a,b上n+1个互异节点,记则插值多项式(x)的余项为 (5.2.4)证明:由插值条件和的定义,当x=时式(5.2.4)显然成立, 并且有 k=0,1,,n (5.2.5)这表明都是函数(x)的零点,从而(x)可表示为(x)=f(x)- (x)=K(x) (5.2.6)其中K(x)是待定函数。对于任意固定的xa,b,x (k=0,1,,n),构造自变量t的辅助函数 (5.2.7)由式(5.2.5)和式(5.2.6)可知和x是(t)在区间a,b上的n+2个互异 零点,因此,根据罗尔(Rolle)定理,至少存在一点(x)(a,b),使得于是,由式(5.2.7)得到代入式(5.2.6)即得式(5.2.4)。由于(x)一般无法确定,因此式(5.2.4)只能用作余项估计。如果在区 间(a,b)上有界,即存在常数0,使得| | x(a,b)则有余项估计(5.2.8)当在闭区间a,b上连续时,可取。推论:设节点, f(x)在闭区间,上连续,记f(x),则过点(,f(),(,f()的线性插 值余项为 (5.2.9)由于在, 上,(x-)(x-)在x=达到 最大值,可得余项的一个上界估计:x,有且计算f(3)的近似值并估计误差。解:由于,插值多项式为于是f(3)(x)=0325因为代入式(5.2.8)得例4:已知sin0.32=0.314567,sin0.34=0.333487有六位有效数字。(1)用线性插值求sin0.33的近似值;(2)证明在区间0.32,0.34上用线性插值计算sinx时至少有4位有效数字。解:(1)用线性插值(2)由式(5.2.10)在区间0.32,0.34用线性插值计算sinx时的余项满足 因此结果至少有4位有效数字。第三节 牛顿插值多项式拉格朗日插值的优点是插值多项式特别容易建立,缺点是增加节点时原有多项式不能利 用,必须重新建立,即所有基函数都要重新计算,这就造成计算量的浪费;牛顿(Newton )插值多项式是代数插值的另一种表现形式,当增加节点时它具有所谓的“承袭性”,这 要用到差商的概念。5.3.1 差商的定义与性质定义:已知函数f(x)的n+1个插值点为,=f(),i=0,1, ,n,称为f(x)在点的一阶差商,记为f,即f= (5.3.1)一阶差商的差商称为f(x) 在点的二阶差商,记为f,即f= (5.2.2)一般地,k-1阶差商的差商称为f(x)在点的k阶差商,记为f,即f= (5.3.3)差商具有以下性质:性质1:n阶差商可以表示成n+1个函数值的线 性组合,即f=事实上,由式(1)当n=1时,当n=2时,一般地有f=性质2(对称性):差商与节点的顺序无关,如这一点可以从性质1看出。性质3:若f(x)是x的n次多项式,则一阶差商f是x的n-1次多项式,二阶差商f是x的n-2次多项式;一般地,函数f(x)的k阶差商f是x的n-k次多项式(kn),而kn时,k阶差商为零。利用差商的递推定义,可以用递推来计算差商,如下表。 一阶差商二阶差商三阶差商注:、表示计算顺序。例1:已知 x1234F(x)021512计算三阶差商f1,3,4,7。解:作差商表一阶差商二阶差商三阶差商 10321415134712-1-3.5-1.25所以f1,3,4,7=-1.255.3.2 牛顿插值多项式设x是a,b上任一点,则由f(x)的一阶差商定义式同理由f(x)的二阶差商定义式得一般地,由f(x)的n+1阶差商定义式f=有即得到一系列等式依次将后式代入前式,最后得:上式可以写为f(x)=+其中: (5.3.4)可以看出,是关于x的次数不超过n的多项式,并且当x=时,有=0 (i=0,1,n)因而有=f(), (i=0,1,,n)亦即满足插值条件,称为牛顿(Newton)插值多项式,再由插值多项式的唯一性可知,因而两个多项式对应的余项是相等的,即由此得到差商与导数的关系性质4 若f(x)在a,b上存在n阶导数,且a,b(i=0,1,,n), 则 (5.3.6)例2:已知f(x)= 解:因,所以由式(5.3.6)得对于牛顿插值,如果增加一个插值节点,则由式(5.3.4)可得如下递推公式这只要在多计算一行差商的基础上增加一项即可。当n=1时,这就是牛顿一次插值多项式,也就是点斜式直线方程。例2:已知 1347f()021512求满足以上插值条件的牛顿型插值多项式。解:在例1中,我们已计算出则牛顿三次插值多项式为例 4:已知f (x)在六个点的函数值如下表,运用牛顿型插值多项式求f(0.596)的近似值,精确到7位小数 。表5-20.400.550.650.800.901.05f()0.410750.578150.696750.888111.026521.25386解:列表5-3如下表5-3f()一阶差商二阶差商三阶差商四阶差商五阶差商0.400.410750.1960.550.578151.11600.0460.650.696751.18600.2800-0.0540.800.888111.27570.35880.1970-0.2040.901.026521.38410.43360.21370.0344-0.3041.051.253861.51560.52600.23100.03460.0003于是欲求,只需在之后再加一项保留7位小数计算即用4次插值多项式即可。5.3.3 等距节点的牛顿插值公式1、差分的定义设插值节点为等距节点:=+ih(i=0,1,2,,n),其中h称为步长,函数y=f(x) 在的函数值为=f()(i=0,1,2,,n),分 别称为f(x)在的一阶向前差分和一阶向后差分,记作=,= (5.3.7) 其中,称为向前差分算子,称为向后差分算子。一阶差分的差分分别称为f(x)在二阶向前差分和二阶向差分差分,记作一般地,m-1阶差分的差分分别称为f(x)在xi的m阶向前差分和m阶向后差分,记作 (9)由差分的定义知,差分计算比差商计算方便得多,因为它省去了除法运算,计算差分通常用 表5-2所示的差分表。表5-4一阶差分二阶差分三阶差分四阶差分2、差分的性质性质 1:n阶差分是n+1个函数值的线性组合, (5.3.11)一般地,可用数学归纳法证明此性质。性质 2:在等距节点的情况下,差分和差商及导数有如下关系: 3、等距节点的牛顿插值公式设等距节点=+ih,记=f() (i=0,1,,n)。当x,时,令x=+th(0tn),如当x为的中点时,x=+2.5h。将牛顿插值公式中的差商用 差分(性质2的公式12)代替,因x- =(+th)-(+ih)=(t-i)h从而,牛顿插值公式在等距插值节点下的形式为: (5.3.14)称为牛顿前插公式。此时余项为类(5.3.15)似在有牛顿后插公式(-nt0): (5.3.16)余项为 (5.3.17)一般来说,如果要计算附近的f(x),用牛顿前插公式;如果要计算附近的f(x),用 牛顿后插公式。例5:设y=f(x)=,插值节点为x=1,1.5,2,2.5,3,用三次插值多项式求f(1.2)和f(2.8)的近似值。解:相应的函数值及差分如下表一阶差分二阶差分三阶差分四阶差分2.712824.481691.763417.289062.807371.1439612.182494.793431.886060.7421020.085547.903053.109621.223560.48146求f(1.2)用牛顿前插公式,此时=1,x=1.2=1+0.4h,故t=0.4,于是2.71828+0.41.76341+1/20.4(0.4-1) 1.14396+ 1/60.4(0.4-1)(0.4-2) 0.74210=3.3338362求f(2.8)用牛顿后插公式,此时=3,x=2.8=3-0.4h,故t=-0.4,于是20.08554+(-0.4.) 7.90305+1/2(-0.4) (-0.4+1) 3.10962+1/6(-0.4) (-0.4+1) (-0.4+2) 1.22356=15.7680872第四节 埃尔米特插值5.4.1 问题的提出面讨论的拉格朗日和牛顿插值多项式的插值条件只要求在插值节点上,插 值函数与被插值函数的函数值相等,即=f()和()=f(),有时 不 仅要求插值多项式在插值节点上与被插值函数的函数值相等,还要插值多项式的导数在这些 点上被插函数的导数值相等,即要求满足插值条件: (5.4.1)的次数不超过 2n+1的插值多项式,这就是埃尔米特(Hermite)插值问题。5.4.2 三次埃尔米特插值我们考虑只有两个节点的三次埃尔米特插值。设插值点为(,),(,),要求一次数不超过3的多项式,满足下列条件: i=0,1 (5.4.2)式中=f(),i=01。类似于拉格朗日插值多项式的构造过程,仍采用基函数的方法来构造, 将表为: =+ (5.4.3)式中,值基函数,为了满 足插值条件,它们应满足下列条件表5-6条件函数函数值导数值100001000100001且均为次数不超过 3的多项式。由表5-6可知,故应含有因子,又是次数不超过3的多项式,因而可将它写成=a+b(x-) (5.4.4) 式中a,b为待定常数。由=1,可得a=再由=0,可得b=将a,b代入式(5.4.4)式得=()类似地, 将,们可得到插值基函数为为 =()对于,注意到,含有(x-)因子,可表示为=c (x-) (5.4.5)式中c为待定常数。由=1,可得c=代入式(5)得=(x-)类似地,将,我们可得到插值基函数为=(x-)显然可简单地表示为 (5.4.6)其中为以为 (,),(,) 插值点的拉格朗日一次基 函数。将的表达式代入式(3)得的表达 式为=()+()+ (x-)+(x-)同Lagrange插值类似,有如下结论:定理1满足条件式(2)的三次埃尔米特插值多项式存在且唯一。证 存在性已由上述构造过程得到证明。下证唯一性。设,均为满足式(5.4.2)的三次埃尔米特插多项式,令Q(x)=-则Q(x)仍为一次数不超过3的多项式,且JZQ()=Q()=Q()=Q()=0即,都是Q(x)=0的二重根,因此Q(x)=0有四个根,这只有当Q(x)0时才能成立,所 以亦即满足条件式(2)的三次埃尔米特插值多项式是唯一的。5.4.3 插值余项与第二节定理1的证明完全类似,可以证明定理2当f(x)的四阶导数在(,)上存在时,三次埃尔米特插值余 项为(x)(,) (5.4.8)记则当x(,),有如下余项估计式例1:已知f(x)=, =121,=144,用f(x)的三次埃尔米特 插值多项式求的近似值,并估计其截断误差。解:由f(x)=,得f(x)=, =11, =12, =1/22,1/24,代入式(5.4.6)得再将上式代入式(3)得=又,故,于是0.000012第五节 分段低次插值 随着插值节点增加,插值多项式的次数也相应增加,而对于高次插值容易带来剧烈振荡,带来数值不稳定,如图5-5。既要增加插值节点,减小插值区间,又不增加插值多项式的次数以减少误差,我们可 以采用分段插值的办法。设给定节点ab,记.5.5.1分段线性插值已知函数yf(x) 给定节点ab的函数值为f(),(i0,1,n) ,求一个分段函数P(x),使其满足:5-5 5-6(1) P(),(i0,1,n);(2) 在每个小区间,上,P(x)是一线性函数。称满足上述条件的函数 P(x)为分段线性插值函数。易知P(x)的图形是一条折线(图5-6),在区间a,b上是连续 的,但其一阶导数是不连续的(即不光滑的)。在每个小区间,上, P(x)=(i=0,1,n-1) (1)或P(x)= (i=0,1,n-1) (2)已知函数y=f(x)=在区间 0,5上取等距插值节点(如下表),求区间 0,5上分段线性插值函数,并利用它求出 f(4.5)的近似值。01234510.50.20.10.058820.03846解 在每个小区间i, i+1上,P(x)=于是5.5.2 分段三次埃尔米特插值已知函数y=f(x)在给定节点ab的函数值及导数值分别为=f(),=f() (i=0 ,1,n),求一个分段函数H(x),使其满足:(1) H()=,H()=(i=0,1,n);(2) 在每个小区间,上,H(x)是一次数不超过3的多项式。称满足上述条件的函数H(x)为分段三次埃尔米特插值函数。易知分段 三次埃尔米特插值函数H(x)及其导数H(x)都是区间a,b上的连续函数,因而是一 种光滑的分段插值,在每个小区间,上,H(3)= ()+()+(x-) +(x-)(i=0,1,n-1)或H(x)=+ (4)(i=0,1,n-1)例2 已知函数y=f(x)=在区间 0,3上取等距插值节点(如下表),求区间0,3上分段三次埃尔米特插值函数,并 利用它求出f(1.5)的近似值。01210.50.20-0.5-0.16解 =1,由式(4),在每个小区间i,i+1上,H(x)=+ 于是H(x)= F(1.5)H(1.5)=0.51.5-0.04(0.41.5-33) =0.31255.5.3分段插值的余项及其收敛性1、插值余项根据拉格朗日线性插值多项式的余项,可以得到分段线性插值函数的误差估计:定理1:设给定节点ab,f(x)在a ,b上存在,则当x,时,|R(x)|=f(x)-P(x)=(,),从而,对xa,b,有R(x)=f(x)-P(x)(5)其中h=-。 =|同理,根据三次埃尔米特插值多项式的余项,可以得到分段三次埃尔米特插值函 数的误差估计:定理2:设给定节点ab,在 a,b上存在,则当 x,时,R(x)= f(x)-H(x)= (,)于是,对xa,b有R(x)=f(x)-H(x)(6)其中h= h=-,=|。2、收敛性由式(5), 若f(x)的二阶导数在a,b上连续,则当h-0时,|R(x)=f(x)-P(x)-0 所以P(x)在a,b上一致收敛于f(x)。再由式(6),若f(x)的四阶导数在a,b上连 续,则当h-0时,R(x)=f(x)-H(x)-0所以H(x)在a,b上一致收敛于f(x)。于是可以加密插值节点,缩小插值区间,使h减小,从而减小插值误差。第六节三次样条插值函数高次插值函数的计算量大,有剧烈振荡,且数值稳定性差;在分段插值中,分段线性插值在分 段点上仅连续而不可导,分段三次埃尔米特插值有连续的一阶导数,如此光滑程度常不能满足物理问题的需要,样条函数可以同时解决这两个问题,使插值函数既是低阶分段函数,又 是光滑的函数,并且只需在区间端点提供某些导数信息。5.6.1三次样条函数定义:设在区间a,b上取 n+1 个节点a=b函数y=f(x)在各个节点处的函数值为=f()(i=0,1,n),若S(x)满足:(1) S()=,i=0,1,n ;(2) 在区间a,b上,S(x)具有连续的二阶导数;(3) 在区间(i=0,1,n-1)上,S(x) 是x的三次多项式;称S(x) 是函数y=f(x)在上a,b上的三次样条插S(+0)=S(-0), (5)S(+0)=S(-0)此时,这样确定的样条函数S(x)称为周期样条函数。5.6.2三次样条函数的计算1、用节点处的二阶导数表示的三次样条函数三弯矩方程由于S(x)的二阶导数连续,设S(x)在节点的二阶导数为,即S(),i=0,1,n,是未知、待定的数。因S(x)是分段三次多项式,则S(x)是分段一次多项式,且在每个 区间上,S(x)可表示为记-,则将上式在区间上积分两次,并且由S(),S() 来确定两个积分常数,可得当x时,S(x)= (5.6.6)对上式求导得:S(x)= (7)利用S(x)一阶导数连续的性质,在上式中令x=,得:将式(7)中的i换成i-1,得S(x)在上的表达式S(x)=用x=代入,得:利用S(0)S(0)可得:两边乘以,得: i=1,2,n-1 (5.6.8)其中 (9)这是含有n+1个未知量共有n-1个方程组成的线性方程组,欲确定该方 程组的解,尚缺2个方程。因此求三次样条函数还要2个附加条件。常见的问题有下面两种提法:第一类问题 附加条件,即给出边界端点的一阶导数值:S(),S(。利用前面已推导的公式,当x时,S(x)= 取i0,x=,得:取in-1,x,得:移项,得:其中与式(8)联立得一n+1元线性方程组: (10)其系数矩阵是严格对角占优的三对角矩阵:可以用追赶法解出(i=0,1,n),将其代入式(6),即得到三次样条函数的分段表达式。第二类问题 附加条件,即给出边界端点的二阶导数值:S() ,S(),代入式(8)得一n-1元线性方程组: (11)其系数矩阵为这是一个三对角矩阵,由于,因而它是严格对角占优的。原方程组 是个三对角方程组,可以用追赶法解出,代入式(6),即得到三次样条函数的分段表达式。2、用节点处的一阶导数表示的三次样条函数三转角方程由于S(x)的一阶导数连续,设S(x)在节点处的一阶导数值为,即S(),i0,1,n,是未知、待定的数。因S(x)是分段三次多项式,则在每个区间 上是三次多项式,且满足S(),S(),S(),S(),故S(x)是, 上的分段三次埃尔米特插值多项式,当x时 S(x)= ()+()+ (x-) +(x-)(i=0,1,n-1) (3)或写为S(x)=+ 将上式在区间上求导两次,可得当x时,S(x)=+ 和S(x) =+ 利用S(x)二阶导数连续的性质, 在上式 中令x=,得:S(+0)=将上式中的i换成i-1 ,得S(x)在上的表达式S(x) =+ 用x=代入,得:S(-0)=利用S(-0)=S(+0)可得:两边乘以,得: (13)其中 (14)这是含有n+1个未知 量共有n-1个方程组成的线性方程组,欲确定该方程组的解,尚缺2个 方程。因此,求三次样条函数还要2个附加条件。有关情形与节点处的二阶导数表示的三次样条函数类似,叙述如下: 第一类问题 附加条件,即给出边界端点的一阶导数值:时,则方程组为: (15) 第二类问题 附加条件,即给出边界端点的二阶导数值:S() ,S(), 时,利用前面己推导的公式,当x时,S(x) =+ 取i=0,x=,得:取i=n-1,x=,得移项,得:其中g0=3fx0,x1-SX()h02SXM0,gn=3fx n-1,xn+SX()hn-12SXMn.与式(13)联立可以建立如下方程组 : (16)两种情形的系数矩阵均为严格对角占优的三 对角矩阵,可 以用追赶法求解,从而得到三次样条函数的分段表达式。例1:已知f(x)的函数值为01230000试分别求函数f(x)满足下列边界条件的三次样条插值函数:(1) S(0)=1,S(3)=0;(2) S(0)=1,S(3)=0.解:,i=1,2.(1)边界条件为=0,用式(15)求解简单。由式(14)计算得JZf0,1=f1,2=f2,3=0,=0代入式(15)得方程组 解得利用公式S(x)=+ i=0,1,2并注意到边界条件=0,求得三次样条函数如下:s(x)=(2)边界条件为,用式(11)计算简单。由 (i=1,2),得=6f0,1,2=6/(1+2)(0-0)/0-(0-0)/1=0=6f1,2,3=6/(1+1)(0-0)/1-(0-0)/0=0代入式(11)得方程组解得S(x)=+ i=0,1,2并注意到求得三次样条函数如下:s(x)= 第七节 反插值假设函数y=f(x)以表格形式给出如下XY反插值 就是要以函数y的值来求自变量的x的值.5.7.1 反插值及余项设函数y=f(x)在含x,,,的区间a,b上严格单调,则由高等数学知识 可知,y与x是一一对应的,即存在反函数x=,此时反插值问题有唯一解存在。 一般情况下,可用拉格朗日插值多项式或牛顿插值多项式,只须将y与x的位置互换即可。如 用拉格朗日插值多项式对上表作反插值有反插值的余项为5.3.2反插值的应用1.已知函数y的值,求自变量x的值;2.求方程f(x)=0的近似根。例1:已知数据如下X10151720y371117求函数y=10时自变量x的值。解:对这四个点,y=f(x)严格递增,故解唯一。用拉格朗日插值公式有x=代入y=10,得到=例2 已知下列数据表是y=f(x)=-x的一组数x0.500.550.600.650.70Y0.106530.02695-0.05119-0.12795-0.20341且方程y=f(x)在区间0.5,0.7内有唯一零点,用反插值求方程f(x)=0在区间0.5 ,0.7内的根的近似值。解:用牛顿插值,列差商表如下i一阶差商二阶差商三阶差商四阶差商00.106530.5010.026950.55-0.628302-0.051190.60-0.639880.073423-0.127950.65-0.651380.07424-0.003504-0.203410.70-0.662600.07371-0.002300.01875由上表可得方程f(x)=0在区间0.5,0.7内的根的近似值依次为:由此可得,-x=0的近似解为0.56714,误差为,实际计算f(0.56714)0,f(0.56715)0.第八节 曲线拟合的最小二乘法一、最小二乘法的基本原理从整体上考虑近似函数同所给数据点(i=0,1,m)误差(i=0,1,m)的大小,常用的方法有以下三种:一是误差(i=0,1,m)绝对值的最大值,即误差 向量的范数;二是误差绝对值的和,即误差向量r的1范数;三是误差平方和的算术平方根,即误差向量r的2范数;前两种方法简单、自然,但不便于微分运算 ,后一种方法相当于考虑 2范数的平方,因此在曲线拟合中常采用误差平方和来 度量误差(i=0,1,m)的整体大小。数据拟合的具体作法是:对给定数据 (i=0,1,,m),在取定的函数类中,求,使误差(i=0,1,m)的平方和最小,即 =从几何意义上讲,就是寻求与给定点(i=0,1,m)的距离平方和为最小的曲线(图6-1)。函数称为拟合 函数或最小二乘解,求拟合函数的方法称为曲线拟合的最小二乘法。在曲线拟合中,函数类可有不同的选取方法.61二、多项式拟合假设给定数据点(i=0,1,m),为所有次数不超过的多项式构成的函数类,现求一,使得 (1)当拟合函数为多项式时,称为多项式拟合,满足式(1)的称为最小二乘拟合多项式。特别地,当n=1时,称为线性拟合或直线拟合。显然为的多元函数,因此上述问题即为求的极值 问题。由多元函数求极值的必要条件,得 (2)即 (3)(3)是关于的线性方程组,用矩阵表示为 (4)式(3)或式(4)称为正规方程组或法方程组。可以证明,方程组(4)的系数矩阵是一个对称正定矩阵,故存在唯一解。从式(4)中解出(k=0,1,,n),从而可得多项式 (5)可以证明,式(5)中的满足式(1),即为所求的拟合多项式。我们把称为最小二乘拟合多项式的平方误差,记作由式(2)可得 (6)多项式拟合的一般方法可归纳为以下几步: (1) 由已知数据画出函数粗略的图形散点图,确定拟合多项式的次数n;(2) 列表计算和;(3) 写出正规方程组,求出;(4) 写出拟合多项式。在实际应用中,或;当时所得的拟合多项式就是拉格朗日或牛顿插值多项式。 例1:测得铜导线在温度()时的电阻如表6-1,求电阻R与温度 T的近似函数关系。i0123456()19.125.030.136.040.045.150.076.3077.8079.2580.8082.3583.9085.10解:画出散点图(图6-2),可见测得的数据接近一条直线,故取n=1,拟合函数为列表如下i019.176.30364.811457.330125.077.80625.001945.000230.179.25906.012385.425336.080.801296.002908.800440.082.351600.003294.000545.183.902034.013783.890650.085.102500.004255.000245.3565.59325.8320029.445正规方程组为解方程组得故得R与T的拟合直线为利用上述关系式,可以预测不同温度时铜导线的电阻值。例如,由R=0得T=-242.5,即预测温度T=-242.5时,铜导线无电阻。6-2例2:已知实验数据如下表i01234567813456789101054211234试用最小二乘法求它的二次拟合多项式。解:设拟合曲线方程为列表如下I0110111101013592781154524416642561664352251256251050461362161296636571493432401749682645124096161287938172965612724381041001000100004040053323813017253171471025得正规方程组解得故拟合多项式为*三、最小二乘拟合多项式的存在唯一性定理1 设节点互异,则法方程组(4)的解存在唯一。证 由克莱姆法则,只需证明方程组(4)的系数矩阵非奇异即可。用反证法,设方程组(4)的系数矩阵奇异,则其所对应的齐次方程组 (7)有非零解。式(7)可写为 (8)将式(8)中第j个方程乘以(j=0,1,,n),然后将新得到的n+1个方程左右两端分别 相加,得因为其中所以 (i=0,1,m)是次数不超过n的多项式,它有m+1n个相异零点,由代数基本定理,必须有,与齐次方程组有非零解的假设矛盾。因此正规方程组(4)必有唯一解 。定理2 设是正规方程组(4)的解,则是满足式(1)的最小二乘拟合多项式。证:只需证明,对任意一组数组成的多项式,恒有即可。因为(k=0,1,,n)是正规方程组(4)的解,所以满足式(2),因此有故为最小二乘拟合多项式。*四、多项式拟合中克服正规方程组的病态在多项式拟合中,当拟合多项式的次数较高时,其正规方程组往往是病态的。而且正规方程组系数矩阵的阶数越高,病态越严重;拟合节点分布的区间偏离原点越远,病态越严重;(i=0,1,,m)的数量级相差越大,病态越严重。为了克服以上缺点,一般采用以下措施:尽量少作高次拟合多项式,而作不同的分段低次拟合;不使用原始节点作拟合,将节点分布区间作平移,使新的节点关于原 点对称,可大大降低正规方程组的条件数,从而减低病态程度。平移公式为: (9)对平移后的节点(i=0,1,,m),再作压缩或扩张处理: (10)其中,(r是拟合次数) (11)经过这样调整可以使的数量级不太大也不太小,特别对于等距节点,作式(10)和式(11)两项变换后,其正规方程组的系数矩阵设 为A,则对14次多项式拟合,条件数都不太大,都可以得到满意的结果。变换后的条件数上限表如下:拟合次数1234=19.950.3435在实际应用中还可以利用正交多项式求拟合多项式。一种方法是构造离散正交多项式;另一种方法是利用切比雪夫节点求出函数值后再使用正交多项式。这两种方法都使正规方程 组的系数矩阵为对角矩阵,从而避免了正规方程组的病态。我们只介绍第一种,见第三节。例如 m=19,=328,h=1, =+ih,i=0,1,,19,即节点 分布在328,347,作二次多项式拟合时 直接用构造正规方程组系数矩阵,计算可得严重病态,拟合结果完全不能用。 作平移变换用构造正规方程组系数矩阵,计算可得比降低了13个数量级,病态显著改善,拟合效果较好。 取压缩因子作压缩变换用构造正规方程组系数矩阵,计算可得又比降低了3个数量级,是良态的方程组,拟合效果十分理想。如有必要,在得到的拟合多项式中使用原来节点所对应的变量x,可写为仍为一个关于x的n次多项式,正是我们要求的拟合多项式。第九节 超定方程组的最小二乘解设线性方程组中,,是 m维已知向量,x是n维解向量,当mn即方程组中方程的个数多于未知量的个数时,称此方程组为超定方程组。一般来说 ,超定方程组无解(此时为矛盾方程组),这时需要寻找方程组的一个“最近似”的解。记,称使即最小的解为方程组的最小二乘解。可以证明如下定理:定理:是的最小二乘解的充分必要条件为:是的解。证:充分性 若存在n维向量,使。任取一n维向量,令, 则,且所以是的最小二乘解。必要性 r的第i个分量为,记由多元函数求极值的必要条件,可得即 (1)由线性代数知识知(1)写成矩阵形式为 (2 ) 它是关于的线性方程

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论