数据的n次拟合多项式_第1页
数据的n次拟合多项式_第2页
数据的n次拟合多项式_第3页
数据的n次拟合多项式_第4页
数据的n次拟合多项式_第5页
免费预览已结束,剩余13页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据的 n 次拟合多项式第一章 绪论1.1 课题国内外研究动态,课题研究背景及意义1.2 国内外的研究现状1.3 发展趋势第二章数据拟合的基本理论2.1 最小二乘曲线拟合2.2 线性拟合函数2.3 二次拟合函数2.4 多项式拟合函数2.5 小结第三章数据拟合的应用实例3.1 数据拟合在物理实验中的应用3.2 数据拟合在经济监控中的应用3.3 模型评价参考文献附录第一章 绪论1.1课题国内外研究动态,课题研究背景及意义数学分有很多学科, 而它主要的学科大致产生于商业计算的需要、 了解数字间的关系、测量土地及预测天文事件。 而在科技飞速发展的今天数学也早已成为众多研究的基础学科。 尤其是在这个信息

2、量巨大的时代, 实际问题中得到的离散数据的处理也成为数学研究和应用领域中的重要的课题。在解决实际工程问题和科学实验的过程中, 经常需要通过研究某些变量之间的函数关系,帮我们去认识事物内在的规律和本质属性, 这些变量间的未知的关系一般隐含在从观测、 试验而得到的一组离散的数据之中。 所以,是否能够根据一组试验观测数据来找到变量之间的相对准确的函数关系成为了解决工程实际问题的关键。在实际问题中, 通过观测数据能否正确揭示某些变量之间的关系, 进而正确认识事物的内在规律与本质属性, 往往取决于两方面因素。 其一是观测数据的准确性或准确程度, 这是因为在获取观测数据的过程中一般存在随机测量误差, 导致

3、所讨论的变量成为随机变量。 其二是对观测数据处理方法的选择, 即到底是采用插值方法还是用拟合方法 1-3 ,插值方法之中、拟合方法之中又选用哪一种插值或拟合技巧来处理观测数据。 插值问题忽略了观测误差的影响, 而拟合问题则考虑了观测误差的影响。 但由于观测数据客观上总是存在观测误差, 而拟合函数大多数情况下是通过经验公式获得的, 因此要正确揭示事物的内在规律, 往往需要对大量的观测数据进行分析, 尤为重要的是进行统计分析。 统计分析的方法有许多,如方差分析、 回归分析等。 数据拟合虽然较有效地克服了随机观测误差的影响,但从数理统计的角度看,根据一个样本计算出来的拟合函数 (系数 ),只是拟合问

4、题的一个点估计, 还不能完全说明其整体性质。 因此,还应该对拟合函数作区间估计或假设检验, 如果置信区间太大或包含零点, 则由计算得到的拟合函数系数的估计值就毫无意义。所以,据科学和工程问题可以通过比如采样、实验等方法而得到若干的离散的数据,根据这些离散的数据,我们往往希望能得到一个连续函数 (也就是曲线 ) 或者更加密集的离散方程与已知数据相吻合。 这个过程叫做拟合。 也就是说,如果数据不能满足某一个特定的函数的时候,而要求我们所要求的逼近函数 “最优的 ”靠近那些数据点, 按照误差最小的原则为最优标准来构造出函数。 我们称这个函数为拟合函数。现在,对数据点进行函数拟合以获得信息模型是许多工

5、程应用领域的一个核心问题。而为了适应这个多元化的世界中, 为了能够满足各种各样的应用领域的要求,针对他们而对各种拟合方法的改进和研究也从未停止过。1.1.1国内外的研究现状在通过对国内外有关的学术刊物 (如计算机科学、宇航学报、中原工学院学报等 )、国际国内有关学术会议和网站的论文进行分析。数据拟合的研究和应用主要是面对各种工程问题, 有着系统的研究和很大的发展。 通过研究发展使得数据拟合有着一定的理论研究基础。 尤其是关于数据拟合基本的方法最小二乘法 4-9 的研究有着各种研究成果。但是,由于现实问题的复杂性, 数据拟合还拥有很好的研究空间, 还有很多能够优化和创新的问题需要去研究和探索。

6、各种算法的改进和应用以及如何得到合适的模型一直是一个比较热门的研究领域。例如,国内外文献里提出了很多基于形状的描述方法,比如傅氏描述子法、多边形法、累积角法等 , 其中以二次曲线和超二次曲线来拟合物体的边界形状并进行物体的描述已获得广泛应用。现在 ,我们应用高次隐式多项式曲线来作为物体的几何模型受到广泛的重视。 应用高次隐式多项式曲线和曲面 10-15为各个领域的数据进行可视化建模还没有广泛的研究。 用隐式多项式曲线来描述数据点集合的轮廓有天然的优势 ,在数据点集合轮廓的拟合过程中,为业务信息建模所具有的优点,其它建模方法根本无法比拟, 这主要是因为隐式多项式曲线有着精确的表达能力,隐式多项式

7、曲线的参数完全取决于它的次数和系数, 解析式明确, 操纵和使用方便,它还具有着天然的数据噪声过滤能力和修补能力。所以说,在现在这个各个工程领域飞速发展的今天, 数据拟合在实际应用与研究中仍然有着不小的发展空间1.2发展趋势应用高次隐式多项式曲线和曲面为各个领域的数据进行可视化建模还没有广泛的研究。用隐式多项式曲线来描述数据点集合的轮廓有天然的优势 ,在数据点集合轮廓的拟合过程中, 为业务信息建模所具有的优点, 其它建模方法根本无法比拟,这主要是因为隐式多项式曲线有着精确的表达能力, 隐式多项式曲线的参数完全取决于它的次数和系数, 解析式明确, 操纵和使用方便, 它还具有着天然的数据噪声过滤能力

8、和修补能力。隐式多项式曲线的信息建模近年有了很大的发展。 对隐式多项式曲线进行分析看出, MinMax 算法十分精确地拟合了数据点的形状,并且非常的稳定,只需要对 3L 集合的权值参数调整问题做进一步的研究, MinMax 等隐式多项式曲线的拟合算法抛弃了需要迭代的优化算法, 只需要求解一个线性方程组就能够确定隐式多项式曲线方程的系数,可以说已经趋于成熟。 我们可以预见, 把这种建模思想应用到各种数据点集合之中必将带来很大的发展空间。随着计算机的广泛应用, 利用计算机相关软件解数据拟合问题也已经成为了不可缺少的步骤。第二章数据拟合的基本理论科学和工程问题可以通过比如采样、实验等方法而得到若干的

9、离散的数据,根据这些离散的数据,我们往往希望能得到一个连续函数(也就是曲线 )或者更加密集的离散方程与已知数据相吻合。这个过程叫做拟合。 也就是说,如果数据不能满足某一个特定的函数的时候, 而要求我们所要求的逼近函数最优的靠近那些数据点,按照误差最小的原则为最优的标准来构造出函数。在科学计算中经常要建立实验数据的数学模型。 给定函数的实验数据, 需要用比较简单和合适的函数来逼近 (或拟合 )实验数据。这种逼近的特点是:(1) 是需要适度的精度的;(2) 实验数据有一些小的误差;(3) 对于一些问题,可能有一些特殊的信息能够用来选择实验数据的数学模型。逼近离散数据的基本方法就是曲线拟合,常采用最

10、小二乘拟合。曲线拟合问题的数学描述是,已知一组(二维 )数据 ( xi , yi) ,i = 1,2, ,n(即平面上的 n 个点 ( i, y) ,i = 1,2, ,n),xi 互不相同,寻找一个函数 (曲线 )y = f(x),xi使得 f(x)在某种准则下与所有的数据点最接近,即曲线拟合得最好。2.1最小二乘法的基本原理从整体上考虑近似函数p( x) 同所给数据点 ( xi, yi ) (i=0,1,m) 误差rip(xi )yi (i=0,1,m)的大小,常用的方法有以下三种:一是误差rip(xi )yi (i=0,1,max ri,即误差 向量,m) 绝对值的最大值 0 i mmr

11、 ( r0 , r1 ,rm )Ti 0 ri的 范数;二是误差绝对值的和,即误差向量 r 的 1m2ri范数;三是误差平方和i 0的算术平方根,即误差向量 r 的 2范数;前两种方法简单、自然,但不便于微分运算,后一种方法相当于考虑2 范数的平方,因此在曲线拟合中常采用误差平方和体大小。m2rii 0来 度量误差 ri (i=0 , 1, , m)的整数据拟合 的具体作法是:对给定数据(xi , yi )(i=0,1, , m),在取定的函数类中 , 求 p(x), 使误差 rip(xi )yi (i=0,1,m) 的平方和最小,即m2m2rip(xi ) yimini 0i 0从几何意义上

12、讲,就是寻求与给定点( xi , yi ) (i=0,1,m) 的距离平方和为最小的曲线yp( x) (图 6-1 )。函数 p( x) 称为拟合函数 或最小二乘解, 求拟合函数 p(x) 的方法称为曲线拟合的最小二乘法。在曲线拟合中,函数类可有不同的选取方法 .612.2 线性拟合函数原理给定一组数据,做拟合直线,均方误差为( 6.2)是二元函数,的极小值要满足整理得到拟合曲线满足的方程:( 6.3)或称式( 6.3)为拟合曲线的法方程。用消元法或克莱姆法则解出方程:a=2.3二次拟合函数给定数据序列,用二次多项式函数拟合这组数据。设,作出拟合函数与数据序列的均方误差:( 6.4)由多元函数

13、的极值原理,的极小值满足整理得二次多项式函数拟合的法方程:( 6.5)解此方程得到在均方误差最小意义下的拟合函数。方程组(6.5)称为多项式拟合的法方程,法方程的系数矩阵是对称的。当拟保多项式阶态的,在计算中要用双精度或一些特殊算法以保护解的准确性。时,法方程的系数矩阵是病2.4 多次拟合函数假设给定数据点 (xi , yi ) (i=0,1,m) , 为所有次数不超过 n(nm) 的多项式构nak xkpn ( x),使得成的函数类,现求一k 0mmn22Ipn (xi )yiak xikyimini 0i 0k 0(1)当拟合函数为多项式时,称为多项式拟合,满足式(1)的 pn ( x)

14、称为最小二乘拟合多项式。特别地, 当 n=1 时,称为线性拟合或直线拟合。显然mnak xikyi )2I(i 0k0为 a0 , a1 ,an 的多元函数,因此上述问题即为求II ( a0 , a1 ,an ) 的极值 问题。由多元函数求极值的必要条件,得Imnak xikyi ) xi j2(0,j0,1, , na ji 0k0(2)即nmm(xijk)akxij yi ,j 0,1, , nk 0i0i 0(3)( 3)是关于 a0 , a1 ,an 的线性方程组,用矩阵表示为mmmm 1xixina0yimi0i0i 0mmmxixi2xin 1a1xi yii0i0i0i0mmma

15、nmxinxin 1xi2nxin yi(4)i0i0i0i0式( 3)或式( 4)称为正规方程组或法方程组。可以证明,方程组( 4)的系数矩阵是一个对称正定矩阵,故存在唯一解。从式( 4)中解出 a k (k=0,1, , n) ,从而可得多项式nak xkpn (x)k 0(5)可以证明,式( 5)中的 pn (x) 满足式( 1),即 pn ( x) 为所求的拟合多项式。我m2pn ( xi )yipn ( x) 的平方误差,记作们把 i 0称为最小二乘拟合多项式2m2pn (xi ) yir 2i 0由式 (2) 可得2mnmyi2ak (xik yi )r 2i0k 0i 0(6)多

16、项式拟合的一般方法可归纳为以下几步:(1) 由已知数据画出函数粗略的图形 散点图,确定拟合多项式的次数 n;mm(2)xi j( j 0,1, ,2n)xij yi( j 0,1, ,2n)列表计算i 0和 i 0;(3)写出正规方程组,求出a0 , a1 ,an ;n(4)写出拟合多项式pn ( x)ak x kk 0。2.5本章小结本章阐述了数据拟合的基本理论及其方法。用最小二乘法论理引出了线性以及二次曲线拟合的方法, 并推广至多元拟合。分别详细介绍了各种方法的理论及其公式。并分别对曲线拟合以及多元拟合的求解的基本步骤做出了归纳。通过本章可以掌握数据拟合的基本方法以及理论基础。第三章MAT

17、LAB解应用问题实例3.1数据拟合在物理实验中的应用现在有一为了测量线性电阻元件伏安特性的物理实验。实验数据见表3-1。表3-1测量线性电阻元件伏安特性的实验数据iI i / AU i / ViI i / AU i / V10060.049520.00917O.061630.020280.073740.030390.082850.0394100.0929由于试验的目的是研究关于线性电阻的伏安特性,所以设拟合多项式为U / V a0 a1I / A(3-1)将数据表代入数据拟合的基本公式里,得此实验的正则方程组10a00.455a1450.455a00.0295 a1=2.9010它的解为 a0

18、= 0.1062 ,a1= 96.5662 因此这一组数据的最小二乘法拟合为U/V=0.1062+96.5662I/An=1时,其各拟合图像为:利用最最小二乘法来分析物理实验里所测得的实验数据, 我们可以根据测得的数据拟合出近似函数,并得到比较精确的解。总之,在实际的实验中,我们应当采用尽可能多的方法去分析数据,使得实验更有意义。3.2数据拟合在经济监测中的应用根据 1995 年到 2003 年中国 GDP增长率变化情况, 建立回归方程 , 具体数据如下:表 3.3.1 1995 年到 2003 年中国 GDP增长率变化年份123456789GDP10.59.68.87.87.187.389.

19、1数据来源:中国商业部GDP报表 (GDP为百分比 )为了研究的方便 , 年份从1995年到 2003 年分别用1到 9这 9 个数字代替 . 由表 3.1 可以看出 GDP的增长率先减后增, 如果采用线性回归 , 由于拟合误差太大, 严重影响了预测的效果 .观察其变化规律采用抛物线回归的方法是比较合适的, 令拟合多项式为nak xkE( x)(3.1 )k0我们采用的是抛物线的形式, 故 n=2, 即e( x)a0 a1xa2 x2(3.2 )根据“最小二乘法原理”对于n 对数据 (xi , yi )i 1,2,L , n; (其中 N=9 )应使 3NF ( xi ) 2F yi=最小值i

20、 1当 n=2时,则( 3.2 )中的系数满足方程组 :a0a1 x a2 x 2ya0 xa1x 2a2 x 3( xy)(3.3 )a0 x 2a1 x3a2 x4( x2 y)式子中的 a0 , a1 , a2 是未知数 , 系数 xk1 Nk, 常数项N i 1xi(xk y)1 Nxik yi. k=0,1,2,3,4N i 1按照上面的过程, 对表中的数据进行拟合,我们首先对方程组的系数和常数项作如下的处理 : 为了让数据精确表达我们想要的结果, 对不能除尽的系数, 小数点后保留6 位; 对常数项则保留小数点后4 位 . 这样得到的增广矩阵如下:94528576.200045285

21、2025367.8000(3.4)2852025153332.3252e + 003经过计算 , 最后得到的回归方程如下:y12.197 - 1.6547x0.1435x 2( 3.5 )当 n=2 时,拟合图像为:表 3.3.2数据拟合下的误差表年份实际值拟合值误差110.510.68580.185829.69.462-0.138438.88.5244-0.275647.87.8740.074257.17.5110.411687.435-0.565277.37.64560.3456888.14340.143499.18.9282-0.1718初步计算其中的最大误差为 -0.57, 误差范围相

22、对较小, 拟合曲线与元数据基本重合,因此该拟合曲线可以较为准确的预测 GDP的发展趋势。3.3模型评价该方法具有如下优点:(1)计算结果惟一,计算量小,便于在PLC、单片机等硬件设备上实现;(2)可精确、方便地实现多年份的GDP增长变化进行实时监测;(3)当所需要的检测数据改变时,只需调整对应多项式的系数,不必改动其它程序设定,能真正的做到拟合用途多元化;(4)保留了原有数据的发展趋势,又增加了数据的拟合发展趋势,让经济学家能够更直观的发现经济中的发展态势,对国家的经济政策作出调整提供了有力的依据。参考文献1 李庆扬 . 数值分析 . 武汉:华中科技大学出版社, 2006,64692 程毛林 . 数据拟合函数的最小二乘积分法 . 大学数学 ,2006,22(1):70 743 张韵华,奚梅成,陈效群数值计算方法与算法(第二版)科学出版社2006,70804 曾长雄 . 离散数据的最小二乘曲线拟合及应用分析 . 岳阳职业技术学院报 ,2010,25(3):96 9

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论