数学建模优秀论文-景德镇历代官窑青花瓷鉴定模型.doc_第1页
数学建模优秀论文-景德镇历代官窑青花瓷鉴定模型.doc_第2页
数学建模优秀论文-景德镇历代官窑青花瓷鉴定模型.doc_第3页
数学建模优秀论文-景德镇历代官窑青花瓷鉴定模型.doc_第4页
数学建模优秀论文-景德镇历代官窑青花瓷鉴定模型.doc_第5页
免费预览已结束,剩余23页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

景德镇历代官窑青花瓷鉴定模型摘要本文针对陶瓷制品年代归属问题主要采用了两种分类方法,一是基于多元统计分析的贝叶斯判别法,二是使用题中所给样本训练bp神经网络而得到的辨识模型,在模型一(贝叶斯判别分析法)的建立过程中首先给出理论分析,建立贝叶斯判别模型,而后我们给出了4组关键的bayes判别函数,在模型求解的过程中我们通过spss软件得到了4组bayes判别函数中的各个因子的参数。根据景德镇历代青花瓷胎、釉化学组成的演变过程,可细划分成元,明、洪武,明、永乐,明、宣德,明、成化仿宣德,明、洪武至永乐,明、成化,明、正德,明、嘉靖,明、万历,清、康熙,清、雍正,清、乾隆代十三个阶段,也可划分成元,明,清代三阶段。在划分成十三类的结果时,通过青花瓷中的胎、釉我们得出了各个朝代景德镇青花瓷的鉴定准确率,依次为瓷胎(71.4%,25%,100%,42.9%,100%,100%,60%,50%,75%,75%,50%,100%,100%),瓷釉(87.5%,100%,33.3%,100%,100%,100%,80%,100%,75%,50%,100%,100%,100%)。在划分成元,明,清代三个阶段时,同样通过青花瓷中的胎、釉我们得出了各个朝代景德镇青花瓷的鉴定准确率,依次为瓷胎(71.4%,82.8%,100%),瓷釉(100%,90%,100%)。然后我们通过多元统计中的典则判别函数和聚类分析,对通过bayes判别分析的结果和误差进行了大致的分析与解释。模型二中通过对神经网络中的不同参数和传递函数进行设置,我们得出了最优参数模型,尤其是对双曲正切函数倾斜度的试探,得出了最佳倾斜度为0.5,在分为13类的情况下我们从样本组中抽取了两组作为检验样本所得到的效果不是非常理想,在分为3类的情况下,我们从样本组中抽取了10组作为检验样本得到了很好的效果,综合胎釉的平均正确率为85%,最高准确率为90%。模型三中我们将前两个模型的优缺点进行对比,采用交互修正的方法对在两种模型所得结果不一致时进行修正,使得最终的判断结果更加趋近与真实解,以达到最优化的效果。 通过以上分析我们制订了一种较为完善的分类系统,为以后鉴定景德镇官窑青花瓷提供了科学的依据。 关键词: 贝叶斯判别分析法 bp神经网络 辨识 1、问题的重述瓷器是我国古代劳动人民的伟大发明。在漫长的文化历史中,各个时期的瓷器在选材用料、制作工艺、造型纹饰以及釉彩款式等方面都有自己的时代特征,这些特征也是后世用以鉴定古瓷器烧制年代的重要依据。官窑青花瓷更是众多瓷器中的佼佼者,所以对官窑青花瓷的鉴定成了一个非常重要的问题。仿古瓷是中国古代瓷器中一种特殊的工艺制品,对象一般是中国古代瓷器中那些久负盛名的瓷窑所生产的制品,这些古代名瓷原料精良、技术优秀、制作考究,代表了中国古代制瓷工艺的最高水平。对于那些现代仿古瓷往往比较容易区分。这是因为现代烧造的仿古瓷产品,无论从工艺条件、原料来源、配方以及文化背景都与古代相差甚远、与古瓷真品比较、现代仿品一般都有古代真品所没有的一些元素出现。这些元素有些是为了使仿古产品更象古代真品而人为加入的、而另一些则是沿用近代工艺的结果。与之相比,对古代仿古瓷的鉴定则相对要困难一些。然而,古代仿古瓷虽然刻意模仿前朝瓷器的工艺特征,但其毕竟是在本朝现有条件基础上烧制的,因而仿古瓷总是要保留本朝瓷器的一些工艺特征,与前朝真品存在差异,主要体现在古代仿古瓷与真品的瓷胎和瓷釉的化学组成就不可能完全一致。根据历代官窑青花制作的过程,在特定的阶段,由于制瓷配方、原料的来源和精制等方面的变化和进步等,反映在该时期制品胎、釉及青花料的元素组成上,就形成了各阶段不同特征的元素组成模式。在保证结果实际应用的可靠性和预报性的前提下,建立讨论景德镇历代青花瓷元素组成模式变化的时间模型,为能真正满足于实际鉴定的要求迈出关键的一步。本文需要研究的问题如下:根据实验得出有关陶瓷制品胎和釉的特征参量后,如何选择数学模型来对官窑青花瓷的胎和釉的归属年代进行判断。2、问题的分析该问题要求对陶瓷制品的胎和釉作出一个合理的分类模型,题目给出了元,明,清三个朝代中官窑青花瓷的胎和釉中主要化合物的含量,为了得到能够准确快速的分类方法,我们先从常用的数学分类模型入手。常要的分类模型有多种,诸如判别分析法,神经网络等,对于此类问题,胎和釉的分类方法基本上是相似的,所以我们可也以其中一个为例即可。考虑到问题中所给样本容量较大,我们从多元统计学的判别分析模型和神经网络辨识模型两方面入手,建立一个完整的系统共三种模型来进行分类,我们以胎的分类为例,给出该分类系统的大体流程。模型一中原始数据给出了元,明,清三大朝代的官窑青花瓷胎中10种主要化合物的质量分数,通过各朝代皇帝年号将其细化为13类年代,而后将数据导入到spss软件中,将bayes判别分析法应用于陶瓷制品胎的年代分类中,建立陶瓷制品胎的年代分类识别的bayes判别分析模型。模型选用陶瓷制品胎中的10种主要化学成分作为分类识别的判别因子,将陶瓷制品胎所分成的13个年代类别作为bayes判别分析的13个正态总体,并假定13个总体样本均为正态总体且协方差矩阵相等,以分类后的青花瓷中胎主要化合物含量的实测数据作为训练样本,建立13个bayes线性判别函数;以bayes线性判别函数计算bayes判别函数值,以最大值对应的总体作为样品所归属的总体;最后以回代法对判别准则进行评价以检验模型的优良性。模型二中立利用bp神经网络的辨识功能对胎和釉分别建立了一个神经网络模型,根据胎,釉中不同的因子个数,设置不同的输入层节点数。输出层均设置了4个输出点,采用二进制编码的显示方法。以上两种模型皆具有较高的分类精度,模型三中将两种模型进行组合,从而希望得到一个分类精度更高的方案。与上述模型一,二中不同的是,模型三种将陶瓷制品总分为3个朝代(即元,明,清),将未知陶瓷制品分别由模型一和模型二进行分类,若两模型所得出的结果一致,则结果显而易见;若结果不一致,则这两个年代应属于工艺十分接近,关联度非常高的两个年代,将两种模型算出来的结果进行交互修正,从而得出最终结果。3、模型的假设和符号的设定3.1 模型的假设(1)假设处于不同时期的青花瓷器的分类是很严格的,即它们之间的元素组成模式有着很明显的差别,各个种类之间有很明显的界限。(2)假设原始数据均很精确,不考虑测量的误差(包括系统误差和随机误差)。(3)题目中所给的样本信息量足够大,且具有一定的代表性,可以反映所在年代陶瓷制品的主要特点。(4)两种分类方法所得的总体均服从正态分布且协方差矩阵相等。(5)任意的陶瓷制品属于所分种类中任一种的概率相等。3.2 符号的设定fi(1) (i=1,2,3,13) 表示使用第一种分类方法按照胎准则的第i类判别函数;fj(2) (j=1,2,3) 表示使用第二种分类方法按照胎准则的第i类判别函数;gi(1) (i=1,2,3,13) 表示使用第一种分类方法按照釉准则的第i类判别函数;gj(2) (j=1,2,3) 表示使用第二种分类方法按照釉准则的第i类判别函数;mse 表示用训练样本将训练好的神经网络仿真后所得到的均方误差值;a 表示整个样本的平均貌似误判率;b 表示110之间的常数。m 表示经验公式中输入层节点的个数;n 表示经验公式中输出层节点的个数;l 表示经验公式中隐含层节点的个数;xk (k=1,2,3,10) 表示贝叶斯判别函数中胎准则的第k个变量xh (k=1,2,3,12) 表示贝叶斯判别函数中釉准则的第h个变量其他变量符号在文中使用是已给出说明。4、模型的建立4.1 问题(1)的模型建立4.1.1 模型一的提出(bayes判别分析法)bayes判别法是假定对研究的现象已有一定的认识,常用先验概率分布来描述这种认识;然后抽取一个样本,用样本来修正已有的先验概率分布,得到后验概率分布,再结合bayes判别函数(即fisher线性判别函数)进行分类。用统计的语言来描述bayes判别分析就是:已知有g个p维总体g1,g2,gg,每个总体gi可认为是属于gi的指标x=(x1,x2,xp)t取值的全体,它们分别具有互不相同的p维概率密度函数f1(x),f2(x), ,fg(x)。在进行判别分析之前,对所研究总体在抽样之前已有一定的了解,常用先验概率来描述这种认识,然后基于抽取的样本再对先验认识作修正,得到后验概率分布以进行统计推断。在实际应用中,判别分析需要提取训练样本中各总体的信息以构造一定的准则来决定新样品的归属问题。4.1.2 模型一的提出 (1)bayes判别函数的提出设两个p维正态总体g1,g2,其概率密度函数为: (1)式中:,为两总体的均值向量和协方差矩阵,为的行列式,i=1,2。假设=,根据马氏距离和判别函数的概念,可得: (2)式中: (3)即为bayes判别函数。(2)多正态总体的bayes判别上述(3)式可以很方便地推广到多正态总体的判别分析中。设g个p维正态总体g1,g2,gg,其概率密度函数为(1),此时:i=1,2,g。假设各正态总体的协方差矩阵相等,即=g =,则得到bayes判别函数为: (4)实际应用中,若,未知,则以训练样本作估计,即以训练样本的样本均值和样本方差作为和的估计,此时: (5) (6) (7)式中:k=1,2,g。(3)多正态总体的bayes判别准则设总体g1,g2,gg的先验概率分布分别为q1,q2,qg,误判损失为c(j/i)(i,j=1,2, ,g,ij)。记c(i/i)=0。在等误判损失下,1其bayes判别准则为xgi,若 判别准则可解释为:对给定的样品x,计算g个总体在x处的概率密度函数值(以bayes函数值wi(x)代替),最大值所属的总体gi即为x所属的类别。模型一采用貌似误判率方法来衡量上述判别准则的优良性。通过对训练样本中的个样品逐个回归,利用回判的误判率来衡量判别准则的效果。貌似误判率即为回判中判错样品的比例。当然,貌似误判率作为真实误判率的估计是有偏的。具体方法如下:设为来自g1,g2,gg的容量分别为n1,n2,ng的训练样本,以全体训练样本作为n1+n2+ng个新样品,逐个代入已建立的判别准则中判别其归属,以 (8)计算平均貌似误判率。式中为属于g1的样品被错判的个数。(4)陶瓷归属年代贝叶斯判别函数的建立基于上述理论分析,针对本题中所提出的陶瓷年代归属问题所采用的两种不同的分类法,我们建立了4个贝叶斯判别函数 按照第一种分类方法的胎准则建立判别函数组(),其中i=1,2,3,13 k=1,2,3,10 按照第二种分类方法的胎准则建立判别函数组(),其中j=1,2,3.按照第一种分类方法的胎准则建立判别函数组(),其中i=1,2,3,13.按照第二种分类方法的釉准则建立判别函数组(),其中j=1,2,3其中, , , ,c1,c2,c3,c4均为各判别函数组中的系数和常数项,可使用spss软件中的bayes判别分析求得,并最终得出4组判别函数组,得出判别函数后根据多正态总体的分类准则对各样本进行分类,最后得出相应的分类表,在模型的求解过程中各组分类函数分别采用fi(1),fj(2),gj(2),gi(1)来简化表示。 4.2.1 模型二的建立(bp神经网络)建立3层bp人工神经网络,包括输入层、隐含层和输出层,各层之间实行全连接,本题基于瓷器的胎和釉两方面分别建立一个bp神经网络模型,下面分别给出胎和釉的网络模型。(1)青花瓷胎分类网络1考虑到在青花瓷胎方面共有10种主要化合物的含量,在输入层设置10个输入点,输出层我们取4个结点,对于输出层我们采用输出编码为二进制编码(此为四位二进制数,且输出时为列的形式)的表达方式,编码输出的0001、0010、0011、0100、0101、0110、0111、1000、1001、1010、1011、1100、1101依次表示十进制中的113,根据输出的二进制编码,先转化成十进制的数,那么它就对应于相应的第几类中。隐含层节点数l的设计非常重要,通常是根据输入层和输出层的节点个数来恰当地选取隐含层中的节点数,我们可以根据如下的经验公式: (8)或(9)通过以上两个经验公式我们选取隐含层节点数为22个。在各层的激励函数选取中,隐含层的激励函数为双曲线正切函数(tansing),对于该bp算法中的双曲正切函数tanh(ax),matlab中默认设置a=1,在网络训练的过程中我们设置了不同的a值以搜索精度最高的倾斜度a。输出层选取激励函数为线性函数(purelin)。(2)青花瓷胎分类网络2与网络1的结构大体上相似,输入层根据青花瓷釉的因子个数,选取12个节点,输出层选取4个节点,采用的输出方法与网络1中一致,均为二进制编码法,隐含层同样采用22个节点,各层的激励函数设置与网络1中一致。(3)bp网络的结构与参数bp网络的结构与参数决定着网络学习的效果和分类识别的精度,其中网络1和网络2的结构图分别如图1,图2中所示。对于网络训练函数,我们采用matlab中的trainlm函数作为网络的训练函数,学习速率设置为默认值0.01,训练次数为1000次,精度要求为10-8,训练时间为1min,在用训练样本训练完成之后再采用原始数据对网络进行仿真,检查训练结果如何,以mse作为观察指标。 图1 bp网络1结构图图2 bp网络2结构图4.1.3 模型三的建立(交互修正分析)模型三在分类的设置方面与模型一,二有明显不同,关于这一点可以在后述的分析中加以说明。对于模型三我们可以采用如下的流程图进行表述。样本bp算法算法bayes两种分类方法所得结果一致不一致交互修正最终结果图表1 交互修正分析法流程图利用模型一对第二种分类方法建立三个bayes判别函数,分类的判别准则与模型一一致,并计算其貌似误判率。使用模型二对第二种分类方法进行分类,由于所分类别不同,调整后的bp算法在网络结构中有所变化,在输出层需使用不同的输出节点数和输出表示方法,具体变化如下:(1)按照胎准则分类输入节点设置为10个,输出层节点设为3个,隐含层为22个,采用竞争式的输出方式,即只有一个节点输出为1,并将该组样即只有一个节点输出为1,并将该组样本归为输出为1的节点类,在传递函数的选取中隐含层和输出层均使用双曲正切函数,其余网络所设置的参数与模型一中网络1的参数一致(2)按照釉准则的分类输入节点设置为12个,输出层节点为3个,隐含层为22个,采用与上述相同的竞争式输出法,在传递函数的选取中隐含层为双曲正切函数,输出层为线性函数,网络所设置的参数与模型一中的网络二参数一致。从模型三的流程图中可以看出,将bayes分析法的特点和神经网络识别的特点相结合,再利用交互修正的方法使所得判别结果趋近与真实情况。5、模型的求解与分析5.1 bayes判别分析的求解5.1.2 按照分类1的求解结果(1)按照胎准则所得到的分类函数f1(1)=544.523*x1+548.999*x2+614.420*x3-525.278*x4+469.025*x5+813.384*x6+606.896*x7+564.307*x8+1539.065*x9+3539.381*x10-27560.284;f2(1)=540.336*x1+545.135*x2+602.238*x3-516.844*x4+464.307*x5+824.032*x6+604.384*x7+556.965*x8+1544.343*x9+3436.277*x10-27144.630;f3(1)=542.575*x1+547.653*x2+609.025*x3-524.602*x4+467.425*x5+810.251*x6+606.329*x7+560.307*x8+1544.925*x9+3444.908*x10-27373.747;(此处只给出前3个判别函数,更多的判别函数可在附录中查到)spss软件除了给出判别函数外,还给出了我们最后的分类结果,由于第一种分类方法所分类别较多,我们就将分类表(表一)作附录,而在此处直接给出分类结果。通过分类表我们发现通过胎鉴定元,明、洪武,明、永乐,明、宣德,明、成化仿宣德,明、洪武至永乐,明、成化,明、正德,明、嘉靖,明、万历,清、康熙,清、雍正,清、乾隆朝代青花瓷的仿真准确率依次为:71.4%,25%,100%,42.9%,100%,100%,60%,50%,75%,75%,50%,100%,100%。有的朝代的青花瓷鉴定通过这个模型仿真准确率很好,但在明、洪武,明、宣德朝代的仿真正确率却低于50%。但是我们如果把分类数减少的话,检验的仿真正确率将有非常大的提升。如果我们可以把青花瓷的种类分成元,明,清三类,通过计算仿真正确率分别达到了71.4%,82.8%,100%,这是一个非常好的效果。我们通过聚类分析法分析个别年代出现的极低的仿真准确率,如明洪武,这个朝代的四个样品有件个归为了明洪武至永乐年代,两件归为明永乐年代,从聚类分析所得出的结果是明洪武至永乐年代与明永乐年代的聚类系数为0.518,明洪武与明永乐之间的聚类系数为0.755,这两个聚类系数在所有聚类系数中相对较小,正是由于这三个年代的陶瓷制品在釉的工艺方面十分相近,且题中该年代所给样本数量仅为4,这样就给判断带来了较大的误差。我们同样可以通过胎的典则判别函数得出更加直观的结论图 3 胎的典则判别函数图通过图3可以看出在各个朝代青花瓷胎的大致分布图。根据过去的研究,我们知道,景德镇历代瓷胎是由单一瓷石作为原料的一元配方演变为以瓷石和高岭土作为原料的二元配方,显然,自元代开始在瓷胎配方中已引进了高岭土,明初基本上沿袭了元代青花瓷胎的配方,都主要已含cao低的瓷石为主,仅惨用了少量高岭土。随后逐渐增加高岭土的用量,明后期个别嘉靖,万历样品al2o3含量增高,不言而喻,其配方中高岭土的用量有了较大的提高。这就是说明景德镇瓷胎配方的变化规律同以往研究工作者提出的景德镇历代瓷胎配方的变化规律是相同的。(2)按照釉所得到的分类函数g1(1)= 10.797*x1 +81.321*x2 -191.610*x3 -14.721*x4 +6.504*x577.234*x6 +37.070*x7 +121.838*x8 -8.795*x9 +141.035*x10 -465.941*x11 +429.676*x12 -1192.307g2(1)= 11.612*x1 +84.351*x2 -215.567*x3 -86.313*x4 +2.855*x593.730*x6 +44.282*x7 +131.465*x8 -14.755*x9 +164.963*x10 -611.788*x11 +485.272*x12 -1316.882g3(1)= 10.755*x1 +79.474*x2 -177.111*x3 -11.038*x4 +6.839*x573.687*x6 +40.142*x7 +118.197*x8 +0.537*x9 +132.283*x10 -472.329*x11 +377.162*x12 -1176.976(此处只给出前3个判别函数,更多的判别函数可在附录中查到)同样,spss给出了最后的分类表(表二),通过表二可以看出,在初始分组案例中,正确率达到了84.1%,基本上达到自己的设想的结果。这样我们在仔细分析上表的数据时,发现通过釉鉴定元,明、洪武,明、永乐,明、宣德,明、成化仿宣德,明、洪武至永乐,明、成化,明、正德,明、嘉靖,明、万历,清、康熙,清、雍正,清、乾隆朝代青花瓷的仿真准确率依次为:87.5%,100%,33.3%,100%,100%,100%,80%,100%,75%,50%,100%,100%,100%。可以总结,用釉鉴别青花瓷样品的朝代仿真准确率更高。但是也有朝代的青花瓷鉴定通过这个模型仿真准确率很低,如明,永乐年间的的仿真正确率为33.3%,出现这个问题的原因和(1)中相似,我们从分类表二中可知三件明永乐的陶瓷样品,一件归为元朝,一件归为了明正德,我们同样通过聚类分析后得知明永乐与元的聚类系数为1.088,明永乐与明正德的聚类系数为0.923,这两个聚类系数在所有聚类系数中相对较小,正是由于这三个年代的陶瓷制品在釉的工艺方面十分相近,且题中该年代所给样本数量仅为3,这样就给判断带来了较大的误差。如果我们同样把分类数减少,检验的正确率将有非常大的提升。这里我们可以把青花瓷的种类分成元,明,清三类,通过计算仿真正确率分别达到了100%,90%,100%。我们同样可以通过釉的典则判别函数得出更加直观的结论图 4 釉的典则判别函数图就瓷釉而言, 景德镇瓷釉历来是用釉果,即风化较浅的瓷石掺以釉灰配成,釉中的cao 含量主要来自釉灰,而k2o和na2o的含量则主要来自釉果。同样,随着不同时期的审美情趣、烧制工艺的不同以及与瓷胎相匹配, 釉果和釉灰的比例也有所变化。通过图4我们可以看出在元代, 瓷釉配方中cao/(k2o+na2o)比值较大,cao的含量较高, 而明洪武年间瓷釉中cao/(k2o+na2o)比值则低得多. 釉灰用量比元代减少。值得注意的的是,明初的洪武年间,其中釉的cao/(k2o+na2o)比值和cao含量不仅低且非常稳定。到了明永乐,明宣德朝时cao/(k2o+na2o)比值又增大了。直到了明,成化时期cao/(k2o+na2o)比值则又低得多。到了明代后期和清朝初期,其数据离散性大。这可能是由于随着烧成工艺水平的提高和瓷胎配方的改进,釉配方也进行着相应的调整和探索。5.1.2 按照分类1的求解结果在以上的分类中我们把历代景德镇青花瓷胎,釉细分成十三类(元,明、洪武,明、永乐,明、宣德,明、成化仿宣德,明、洪武至永乐,明、成化,明、正德,明、嘉靖,明、万历,清、康熙,清、雍正,清、乾隆),在通过多元统计判别分析得出结果。我们发现在预测青花瓷样品朝代的准确率时,达到的准确率并不是很理想。这样我们可以把44个样品数据初步分成元,明,清代三类,然后再把数据与进行了分成十三类的进行对比。从中找出内在的联系。(1) 按照胎准则所得到的分类函数f1(2)=562.061*x1+ 574.673*x2+485.257*x3-348.812*x4+ 361.739*x5+ 757.186*x6+ 550.830*x7+ 542.843*x8+1869.336*x9+ 1028.735*x10-28273.520f2(2)= 559.584*x1+ 572.905*x2+478.908*x3-347.452*x4+362.387*x5+ 762.271*x6+ 550.635*x7+ 538.215*x8+ 1872.303*x9+ 965.300*x10-28041.591f3(2)=559.489*x1+575.932*x2+478.305*x3-342.731*x4+367.629*x5+746.231*x6+556.586*x7+537.828*x8+ 1868.843*x9+ 932.143*x10-28121.617从spss给出的分类结果表(表三)我们可以得出更加直观的结果。 表 3 胎分类结果表总的分组案例中正确分类的达到了84.1%,元,明,清样品的分类正确率分别达到了71.4%,82.8%,100%,是一个非常理想的效果。(2)按照釉准则所得到的分类函数g1(2)= 9.069*x1+ 60.213*x2-88.471*x3+ 54.349*x4+14.263*x5+ 16.223*x6+ 33.182*x7+ 63.665*x8+ 14.550*x9+60.984*x10-158.475*x11+297.714*x12-939.374g2(2)= 9.256*x1+ 59.229*x2-87.388*x3+46.599*x4+14.378*x5+ 20.141*x6+ 37.598*x7+61.788*x8+ 16.381*x9+57.255*x10-201.833*x11+305.237*x12-951.622g3(2)= 8.998*x1+60.461*x2-92.775*x3+77.020*x4+13.484*x5+18.682*x6+ 28.018x7+ 53.808x8+ 10.376*x9+45.167*x10-37.548*x11+ 309.333*x12-890.062从spss给出的分类结果表(表三)我们可以得出更加直观的结果。表 4 釉分类结果表表4可以看出在景德镇青花瓷釉的预测分类中总的分组案例中正确分类的达到了93.2%,元,明,清样品的分类正确率分别达到了100%,90%,100%。根据上述分析可以得出以下结论:根据景德镇历代青花瓷胎、釉化学组成的演变过程,可细划分成元,明、洪武,明、永乐,明、宣德,明、成化仿宣德,明、洪武至永乐,明、成化,明、正德,明、嘉靖,明、万历,清、康熙,清、雍正,清、乾隆代十三个阶段,也可划分成元,明,清代三阶段。划分成的不同阶段,在鉴定古景德镇青花瓷的研究分类上各有优缺点。在将景德镇历代青花瓷胎、釉化学组成的演变过程划分成十三阶段,这样得到的判别函数有十三组。在鉴别古景德镇青花瓷的分类上能够细分到在那个朝代的那个年号时期。但是在准确预测率上有的朝代十分低,比如在明、洪武,明、宣德朝代青花瓷胎的正确率低于50%。这是这个检测方法的缺点。有的朝代准确预测率偏低的原因主要是有些朝代的景德镇青花瓷在胎、釉的配方有些相似的地方。我们可以通过多元统计中的聚类分析能够检测出各个朝代青花瓷胎、釉在化学组成上的近似程度。另外,我们还发现在对景德镇历代青花瓷的胎、釉化学组成成分的统计中。最后得到的一个朝代在胎、釉的准确预测率是有所不同的,比如:在检验明、洪武时期的青花瓷胎的准确预测率为25%,而在检验明、洪武时期的青花瓷釉的准确预测率为100%。似乎我们可以根据得出的各个朝代青花瓷胎、釉检测准确预测率,来综合预测青花瓷的朝代。这样可以提高总的准确预测率。还有在青花瓷釉的检验准确预测率上普遍高于青花瓷胎的检验准确预测率,所以在鉴定古青花瓷的年代时主要以青花瓷的釉为主要依据。在将景德镇历代青花瓷胎、釉化学组成的演变过程划分成三阶段,这样得到的判别函数有三组。采用此种分类检验方法一个优点是最后的准确预测率很高。对于景德镇古青花瓷鉴定上十分准确。但是,这种检验方法不能把鉴定的古青花瓷细致的分类到一个朝代的具体年限。只能粗略地分类到,元明,清朝。5.2 bp神经网络分类方法的求解由神经网络得出的结果中包含输入层至隐含层的权值,隐含层至输出层的权值及隐含层和输出层的阈值,数据较多,均作在附录中,。在求解的过程中我们不断更换双曲正切函数的倾斜度,得出了最佳倾斜度为0.5,在分为三类的模型中我们从所有样本中抽取了10个样本作为检验样本,由于初始迭代值的设定由matlab随机选取,按照胎和釉的两种准则,我们均得出了检验正确率为90%的较好效果,现分类说明。5.1.2 按照分类1的求解结果(1) 按照胎准则所得到的结果我们分别调用神经网络程序和使用matlab工具箱两种方法进行计算。在这里我们没有从原训练样本中抽取个别样本作为检验样本,得到的仿真效果很好,样本均方误差 mse =1.1204*10-8。下图中(图5)给出了该网络训练的结果。图 5 分类一胎网络训练结果图从图中可以可以看出网络训练所得的误差很小,达到目标值,且训练次数较一般神经网络低,搜索速度较快。对于该种请况,我们又从原始训练样本中抽取了2个样本作为检验样本。考虑到各类样本的个数,我们从分类样本个数较多的胎类(第一类和第四类)中分别抽取了5号和17号。通过42个样本训练网络而后进行仿真所得到的mse=9.5554*10-9,而后用仿真好的网络检验抽取的样本5号和17号,得到的检验结果如下:5号样本17号样本-0.5332-0.72172.09050.3765-1.0385-1.90241.5660.1712从中可以看出辨识效果不是非常明显,检验数据未能反映出样本所在的类别,且检验样本的mse =1.3251,相对于训练样本来说误差较大。此处产生误差主要是因为所分类别较多,每类样本个数较少,使得样本的训练结果不佳,未能很好地对未知样本进行检验。(2)按照釉准则所得到的结果在这里我们没有从原训练样本中抽取个别样本作为检验样本,得到的仿真效果很好,样本均方误差 mse =6.1968*10-9。图 6 分类一釉网络训练结果图5.2.1 按照分类2的求解结果(1) 按照胎准则所得到的结果在这里我们剔除的十个样本分别为4,9,13,16,18,20,26,30,34,38,将剩余的34组样本去训练网络,得到的网络训练结果图如下。图 7 分类二胎网络训练结果图其中样本mse =1.4084*10-8。下表给出了通过网络检测后的结果,其中只有第一组的检测结果为错误,正确率为90%,检测样本的mse=0.0695123456789100.00000.00000.00000.00000.00000.29230.00000.00000.00000.00001.00001.00001.00001.00001.00000.97961.00001.00001.00000.00000.00000.00000.00000.00000.00000.00000.00000.00000.00001.0000 (2) 按照釉准则所得到的结果在这里我们剔除的10个样本分别为4,10,18,20,27,28,32,33,36,40,得到了两组比较好的检验结果如下。123456789101.00000.00000.00010.00000.00000.00000.00000.00000.00000.00000.00001.00000.08731.00000.99990.00001.00001.00000.94930.00240.00000.00000.00020.00000.05520.99590.00000.00000.11370.7356其中第三组和第六组是错误的,正确率为80%,训练样本的mse=5.5416*10-9,检测样本的mse=0.0971.从下表的结果可以得出只有第八组是错误的,正确率为90%,训练样本的mse=0.0073,检测样本的mse=0.0506.虽然均方误差较前一次过大,但训练样本分类数据还是比较明显,并且检测样本正确率更高。123456789100.9987 0.0018 0.0072 0.0002 0.0004 0.0013 0.0613 0.3165 0.0001 0.0028 0.0045 0.9818 0.9558 0.9963 0.9803 0.9553 0.6860 0.2304 0.7892 0.4996 0.0060 0.0123 0.0272 0.0114 0.0482 0.1549 0.4544 0.0258 0.3934 0.8113 综合胎,釉的最优检测结果,我们发现明朝的错判率较高,在使用bayes判别分析时,部分明朝的准确率高达90%以上,我们可以通过bayes判别分析中个别年代突出的高鉴别率来修正神经网络模型中的整体鉴别率,使鉴别结果得以最优化。6、模型的总体分析1. 模型的误差分析(1)由于模型在分类方法的确定上存在很大的差别,本例中选用了分为13类和3类的两种分类方法,当使用第一种分类方法时,由于各类的样本数据很少,有的类别甚至只有2个样本,这样所得出的分类不具有显著性,用其来训练神经网络和用bayes方法来进行判别时都会带来较大的误差,我们从模型一和模型二求解所得出的结果就可以得知。(2)在使用bayes判别分析法时,假设了所有样本均服从正态分布且协方差矩阵相等,当采用分为3类的方法时,每一类所拥有的样本容量较大,具有一定的代表性,能够反映3个总体的情况,基于该假设所带来的误差不是十分显著,而采用分为13类的方法时,样本容量相对降低,此时样本不再具有明显的代表性,误差则明显加大,bayes仿真效果明显不如第二种分类方法的要好,甚至有个别年代的错判率高达75%。(3)在使用bp神经网络进行分类时也遇到了和bayes方法中相似的问题,由于样本个数的限制,对网络的学习效果有明显的影响,我们通过调整学习率,双曲正切函数的倾斜度,传递函数等能够将网络的仿真精度控制在10-8左右的数量级内,但是由于bp网络本身的缺陷,如通常选用最速梯度法来搜索最优值,在初始值选取不佳时,很容易收敛得到局部最优值而不是全局最优值,这些因素对分类的结果都会产生一定的误差。(4)由假设(5),将先验概率视为相等,在进行第一种分类方法时,剔除个别原始数据对先验概率的影响较小,本文中在使用bayes判别分析法时并没有使用剔除个别原始数据中而将其作为检验样本的方法,这是因为从训练样本中抽取数据具有随机性,如使用此方法则会引入随机误差,剔除部分数据后也会影响到bayes判别法仿真的效果。2. 模型的稳定性分析本文中在使用神经网络进行分类时稳定性不是很高,这是因为均方误差函数的初始迭代值是由matlab软件随机选取的,迭代方式采用最速梯度法,得出局部最优值的概率较大,所以对同一样本进行分类时,得出的结果很有可能不同,极大影响了系统的稳定性。3. 模型的可靠性分析常用的判别分析方法有距离判别法、贝叶斯判别法、费希尔判别法逐步判别法,序贯判别等。从理论上来讲,bayes判别很完善,与其余判别分析法相比,bayes判别法克服了其两个不足:一是bayes判别法考虑到了先验概率,这在进行异常类判断时仍然能够保持较高的精度,二是bayes判别法考虑了误判的损失。7.模型的优缺点评价7.1 模型的优点(1)模型一中采用bayes分析法,将样本分为13类,对于大多数情况下的仿真准确度都高于70%,此处没有从样本中随机抽取若干样本作为检验样本,没有引入因为随机抽取时而产生的随机误差,增加了模型的检验精度。(2)模型二采用神经网络分类的方法,传统的分类方法时一种模型驱动方法,大部分统计模型基于线性回归,而神经网络用数据驱动方式来解决问题,它通过样本学习逼近实际系统模型的能力很强。(3)由于bp网络的信息分布性,各输入变量对输出变量的影响在样本学习时已自动记下,并由整个网络的内部表达而表现出来,从而省略了通常建模前所需的对各变量的相关性分析。(4)模型三将bayes判别分析和神经网络结合起来,在分类方面也减少了分类个数,提高了样本的相对容量和代表性,从模型一的求解中可以看出bayes分析法在若干年代中的鉴别率高达100%,而神经网络模型的整体鉴别率较高,模型三将两个模型有机的结合在一起,用bayes分析法中个别年代突出的高鉴别率来提高神经网络模型中的整体鉴别率。7.2 模型的缺点(1)模型一将样本分为13类,使得每个样本的相对容量降低,样本的显著性明显下降,给判别带来了较大的误差。(2)bayes判别法在实际应用中可操作性不强。在实践中,除了能获得误判损失函数外,其它的参数与概率分布都是难以获得。因而通常假设样本服从某正态分布。事实上,在统计分析时假定正态分布前提是基于大样本。本题中所给样本个数虽有44组,即使采用分为三类的方法,每一类的样本个数也相对较少。因此,如果概率分布假定与实际总体情况不一致将产生误判,误判率与分布概率偏差有正向关系。(3)bp模型的目标函数为非线性函数,在这里采用的是最速梯度法搜索最优值,由于初始值设定的随机性使得最优值很有可能为局部最优,这在很大程度上影响了系统的稳定性。(4)对于bp模型,在存储于各权上的知识人们无法了解,所建立的模型难以用解析式表达出来。(5)模型三种提出了将模型一和模型二有机结合的概念,但并没有提出一个十分完善的组合方法。8.模型的改进方向通过对模型所求出的解的分析和模型的优缺点评价,我们得出了以下几大改进方向。(1)贝叶斯判别分析的前

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论