基于主成分分析法的远处燃烧体物质元素含量的测定模型_第1页
基于主成分分析法的远处燃烧体物质元素含量的测定模型_第2页
基于主成分分析法的远处燃烧体物质元素含量的测定模型_第3页
基于主成分分析法的远处燃烧体物质元素含量的测定模型_第4页
基于主成分分析法的远处燃烧体物质元素含量的测定模型_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2015大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊

2、和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B中选择一项填写): B 我们的参赛报名号为(报名编号): 133 所属学院(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 日期: 2015 年 5 月 18 日评阅编号(由组委会评阅前进行编号):基于主成分分析法的远处燃烧体物质元素含量的测定模型摘要:利用主成分分析法对远处燃烧体物质元素含量进行分析,将得到的综合主成分指标代替原先较多的评价指标建立数学模型,从而对各物质元素含量测定进行评价分析。结果表明,该方法能用降维的思想将问题简化,来得到可信客观的结论。关键词:主成分分析法;碳元素含量;综合评价;指标0

3、 引 言 对于燃烧体而言,若其碳元素含量不同,则各个光波长对应的光强度也不同。因此,建立碳元素的含量与各个光波长对应的光强度之间的关系模型,对研究不同光强时的元素含量有着重要的意义。然而在研究此问题的时候,总会借助于有一定相关性的多个指标,这样便增加了分析此问题的复杂性,而我们可以利用主成分分析法将这些多个相关的指标转换为少数互相无关的综合指标进行更方便的研究。1 主成分分析法的原理主成分分析法是利用一种降维的方法,用较少的新变量指标来代替众多的原变量,使这些新变量能尽可能的代表原变量所蕴含的信息,且彼此之间互不相关。这种将多个变量用较少的互不相关的变量来表示的统计分析方法叫做主成分分析法。定

4、义:记为原变量指标,为新变量指标,(1) 与互不相关;(2) 是的一切线性组合中方差最大者,是与不相关的所有线性组合中方差最大者。所以新变量分别称为原变量指标的第1,第2,第m主成分。2 主成分分析法的计算步骤(1) 计算相关系数矩阵 (i,j=1,2,p)为原变量与的相关系数, ,其计算公式为(2) 计算特征值和特征向量 特征方程用雅可比法求出特征值,并排序而特征向量可用公式(3) 计算主成分贡献率和累计贡献率 贡献率: 累积贡献率:(4) 计算主成分载荷 (5) 各主成分得分 3 远处燃烧体物质含量的测定 问题(1):针对data0.csv包含的数据建立变量data由变量x1-x3648计

5、算或者估计的数据模型: A对数据进行主成分分析: 本题所给的data0.csv数据中为第一行为格式数据,其中no,data,x1,x2,x3648分别为数据的序号,碳元素的含量,245nm光强度,1044nm光强度。此处光强度值是某一种固定参考强度的倍数,且x1-x3648变量的光波长差是一个常数。 在原数据中,每一次的样本包含3648个变量,要从19次的样本中直接得出碳含量与3648个变量的关系是不合实际的,故需要采用主成分分析法对3048个变量进行降维处理。 在实际的操作中,我们先使用matlab读入csv文件中的数据,再使用zscore函数对数据矩阵进行标准化,然后使用matlab自带的

6、主成分分析法的函数princomp得出从原始数据到各主成分的变换矩阵、降序排列的各成分的贡献率及变换后得出的各成分所构成的19*3548矩阵。 在对此数据的分析中我们得出第一主成分的贡献率达到了85.82%,故我们在之后的数据拟合中只采用19个样本的第一主成分作为自变量。 B拟合 得到了十九个样本对应的第一主成分与碳含量之后,我们对这十九个点进行了拟合。有两种方案, a多项式拟合 f(x) = p1*x8 + p2*x7 + p3*x6 + p4*x5 + p5*x4 + p6*x3 + p7*x2 + p8*x + p9其中:p1 = 6.55e-14-1.115e-13,p2 = -3.9

7、35e-12 p3 = -1.212e-09 p4 = 1.507e-08p5 = 4.738e-06 p6 = -9.252e-06 p7 = -0.004504 p8 = -0.001392 p9 = 21.69 bfourier拟合f(x) = a0 + a1*cos(x*w) + b1*sin(x*w) + a2*cos(2*x*w) + b2*sin(2*x*w) + a3*cos(3*x*w) + b3*sin(3*x*w) + a4*cos(4*x*w) + b4*sin(4*x*w) + a5*cos(5*x*w) + b5*sin(5*x*w) + a6*cos(6*x*w)

8、 + b6*sin(6*x*w)其中:a0 = 697.6 ,a1 = -1230 ,b1 = 292.1 ,a2 = 922.8 ,b2 = -460.4 ,a3 = -564.6 ,b3 = 463.9 ,a4 = 270.5 ,b4 = -339.7 ,a5 = -88.85 ,b5 = 176.9 ,a6 = 12.92 ,b6 = -53.95 ,w = 0.02808。 问题(2):预测data1.csv包含的碳元素的含量data A采用(1)中多项式拟合得到的模型,记x为第一主成分,则data = p1*x8 + p2*x7 + p3*x6 + p4*x5 + p5*x4 + p

9、6*x3 + p7*x2 + p8*x + p9其中:p1 = 6.55e-14-1.115e-13,,p2 = -3.935e-12 ,p3 = -1.212e-09 ,p4 = 1.507e-08 ,p5 = 4.738e-06 ,p6 = -9.252e-06 ,p7 = -0.004504 ,p8 = -0.001392 ,p9 = 21.69。 我们对data1.csv中的数据进行主成分分析时的变换得到另一组所需坐标下的数据,将第一列的数据代入上式进行验证:Data =21.319341123557221.056422032612820.915675317877621.0991331

10、40008819.470466194121821.222448784109120.587937000369720.860610451489621.090756253215220.499589341361521.034845183817821.3032179740113-181.85930332933813.342843313235220.615844304797221.140122007246520.3668406319181-9157.46356359878-16350.4653108800而data1.csv中Data =35.390000000000020.100000000000012

11、.480000000000014.270000000000017.720000000000034.900000000000012.890000000000022.510000000000012.580000000000021.140000000000029.620000000000023.910000000000022.600000000000023.680000000000062.530000000000035.950000000000030.220000000000012.250000000000032.4500000000000 B建立评估标准 记从模型中得出的data为d,所给的实际d

12、ata为D。 则我们记S = sum(dij-Dij)2为评估模型准确性的参数。 对于通过主成分分析与多项式拟合得到的此模型,其在data1.csv中数据参考下的S为3.5253e+08;不难看出此模型在data1.csv中数据变换后的第一主成分下三个点处存在较大的瑕疵,对S有着很大影响,需在后面进一步引入对信息的过滤和对模型的优化。4 模型的修正 由于获得光谱数据时会受到许多不确定因素的影响,如样品不同成分之间相互干扰导致的光谱谱线的重叠、信号噪声等问题,因此可以对data0.csv所包含的数据进行消除噪声、波长优化选择等处理后可以更好的提高模型的性能。 1)噪声消除在实际问题中,通常使用小

13、波变换进行降噪消噪。小波变换通过伸缩平移运算对信号进行多尺度的变化,达到高频处时间细分,低频处频率细分,并能自动适应时频信号分析的要求,最终聚焦到信号的任意细节。小波变换具有时频分析的优势,因此其在降噪消噪的同时也能很好地保留信号的突变部分;它也可以被看作低通滤波,很好地保留原始信号的特征;它还具有选基灵活性,针对不同的对象选取不同的小波基。目前常用的小波变换降噪消噪的方法主要有空域相关消噪法、模极大值消噪法以及小波阈值消噪法。其中小波阈值消噪法将绝对值较小的系数置零,绝对值较大的保留,最后重新构造出更理想的信号。该方法简单、计算量小,因此在实际中得到了很大的应用。在当前,小波变换也经常被用于

14、图像去噪、地震数据处理等。2) 波长优化选择波长优化选择是指对所获得的波长数据进行一定的筛选之后得到较为理想的数据,然后再参与数学建模之中。与未经过波长优化选择而直接进行建模相比,其更简单,且具有更高的稳定性。目前常用到的波长优化选择的方法主要有遗传算法、逐步回归分析法以及区间偏最小二乘法等。对于给出的数据,遗传算法将波长分布平均分为多个子空间,然后子空间进行不同的组合,最后找到一个能够反映全部数据的最佳组合来参与我们的数学建模。经查阅资料以及相关的基本计算可知,遗传算法可以使波长点数减少,缩短建模所需时间,并且去除噪声比较大的区域,从而提高模型的性能。同时也可以在遗传算法中加入一种可以进行自

15、我调节和交叉因子的值的算法,经过交叉因子形成正反馈,提升了遗传算法的运算速度。这种方法在当前有很大的应用,如用于全光网中静态路由与波长分配的优化、选择近红外光谱谱区等。 5 燃烧物体中铁元素含量的研究 首先可以在网上查到铁元素的特征谱线,然后和燃烧物体的各元素的特征谱线进行比较,若燃烧物体的特征谱线不包含铁元素的特征谱线,则燃烧物体中铁元素含量为零;否则,燃烧物体含有铁元素。接着可通过在网上查阅资料得到当燃烧物体含有不同含量的铁元素时,其各个波长对应的光强度。参考(1)所建立的主成分分析模型,可建立基于主成分分析法的远处燃烧体物质铁元素含量的测定模型。然后便可根据所建立的模型预测data0.c

16、sv、data1.csv包含的碳元素的含量data。参考文献:1 王凤花,朱海龙,戈振杨,近红外光谱数据建模方法的研究进展,56-60, 2009。2 田兵,主成分分析的数学模型及实际应用,18-21,2010。3 李蔚,何军,刘德明,黄德修,改进遗传算法应用于全光网中静态路由与波长 分配的优化,133-136,2004。4胡良剑,孙晓君,MATLAB数学实验,高等教育出版社,2008。附录:mat文件中各变量的说明:M: data0.csv中包含碳元素含量的数据;X: data0.csv中不包含碳元素含量的数据;X1:data0.csv中不包含碳元素含量的数据的标准化矩阵;a:data0.c

17、sv中不包含碳元素含量的数据的标准化矩阵到另一坐标下的变换矩阵;b:data0.csv中不包含碳元素含量的数据的标准化矩阵在另一坐标下的矩阵;c:b中各成分的贡献率;data:根据已建立的模型从data1.csv中数据得出的19个样本的碳含量;data1zhuchengfen:从data1.csv中数据得到的第一主成分的19个值;p19:模型中参数;t:临时变量;x:data0.csv中的第一主成分的19个值;x1:data1.csv中的第一主成分的19个值;y:data0.csv中的第一主成分的19个值对应的碳含量;y1:data1.csv中的第一主成分的19个值对应的碳含量;yz:data

18、1.csv中不包含碳元素含量的数据;yyz:data1.csv中不包含碳元素含量的数据的标准化矩阵;yyyz:data1.csv中不包含碳元素含量的数据的标准化矩阵在另一坐标下的矩阵;程序代码:M = csvread(data0.csv,1,1)X = csvread(data0.csv,1,2);X1 = zscore(X);a,b,c=princomp(X1);c=100.*c/sum(c)x=b(:,1)t=csvread(data0.csv,1,1)t=t(:,1)y=tyz=csvread(data1.csv,1,2)yyz=zscore(yz)yyyz=yyz*ax1=yyyz(:,1)y1=csvread(data1,1,1)y1=csvread(data1.csv

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论