




免费预览已结束,剩余15页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本科毕业论文题 目 正交试验在工农业生产一些问题的应用 目 录标题1中文摘要11 引言12 正交试验的基本思想和方法13 无交互作用的工业氨生产问题23.1 一对多支持向量机(1-a-r svm)23.2 一对一支持向量机(1-a-1 svm)33.3 基于线性规划的多类支持向量机算法43.4分解算法53.5 应用最小二乘支持向量机进行分类54有交互作用的农业水稻产量问题65总结和注意事项8参考文献9致谢.10附录.11外文页.15 正交试验在工农业生产一些问题的应用杨学民摘 要 在工农业生产中中,往往要进行一些生产试验,在试验中为达到最大产量的目的,通常是改变一些因素,安排一系列的对比试验,然后通过对实验数据的分析,找到最佳的生产方案。这里面就存在如何设计实验方案和如何分析试验结果的问题。正交试验法就是应用正交表合理安排多因素试验方案并科学分析试验实验数据的一种数学方法。它能减少试验次数, 较快地抓住主要因素, 从而找到满意的生产条件,它对缩短试验周期,节省试脸费用具有很大意义。本文介绍分析了正交试验的基本思想原理,和对数据的分析方法。然后对无交互中作用的氨生产和有交互作用的水稻生产进行实例应用。最后对此方法进行总结和对有关注意事项进行说明。关键词 试验 生产 正交实验法 氨 水稻第1章 引言 在工农业生产中, 通常要做很多多因素试验。试验是需要花费人力物力与时间的 因此在试验之前必须好好设计一番,以最大限度地减少实验次数, 缩短试验周期,同时又能获得明确可靠的结论。对此我采用的是正交试验设计法。正交试验设计法, 是使用已经造好了的表格一一“ 正交表” , 来安排试验的。它能在很多的试验中选出代表性强的少试验条件, 并能通过少数试验条件, 推断找到最好的生产条件。正交试验设计是在工农业实际中比较容易掌握和最具有实用价值的一种试验设计方法, 它通常适用于多因素、多指标具有随机误差的试验条件的研究。这种方法在第二次世界大战后在日本普遍推广。据某些日本专家估计,“日本经济发展中至少有10%的功劳归功于正交设计”,可见效益之大,在我国,正交设计也有很多应用,它的进一步推广将使我国的“四化”建设取得更加丰硕的成果。对数据的分析方法,有极差分析法(直观分析法)和方差分析法,但是方差法得到结论不够精确, 而且对影响试验结果的各因素的重要程度也不能给出精确的数量估计。为了弥补极差的不足, 很多文章还采用了方差分析法。在实际问题中,有很多影响结果的因素,其中有相当多的试验中,因素之间是交互作用的,对于有交互作用不能忽略的试验,也要挑选这两个因素能使指标达到最好的水平搭配,这也可以用正交试验法进行分析。第2章 正交试验的基本原理2.1正交法应用的几个常用名词试验设计法的基本概念 正交试验设计法,它是以概率论数理统计、专业技术知识和实践经验为基础,充分利用标准化的正交表来安排试验方案。并对结果进行分析,来减少试验次数,缩短试验周期。它是产品设计过程和质量管理的重要工具和方法。 正交法应用中几个常用名词 1 指标。正交设计中,根据实验目的而选定用来考察或衡量实验结果好坏的特性值。指标与试验目的是相对应的。例如,实验目的是提高产量,则产量就试验要考查的指标。 2 因素。是实验中考查对试验指标可能有影响的原因或要素。通常用大写字母a,b,c等来表示。一个大写字母代表一个因素。 3 水平。试验中选定的因素所处的状态和条件的不同可能引起试验指标的变化,因素的这些状态和条件成为水平。通常用“1”“2”“3表示。同理,一个因素也可分4水平,5水平或者更多水平,以此类推。2.2正交法的基本工具 正交法的基本工具是正交表。它是一种依据数理统计原理而制定的具有某种数字性质的标准化表格。正交表符号为:ln(mk),其中字母l表示正交表,n为试验次数m为因素水平数,k试验因素数。以基本的!l4(!23!,)正交表为例: 该表是一个3列4行的矩阵,每一个因素占用一列,该表最多能考察3个因素每个因素分为2水平,共有4行,也就是有4个实验方案,每1行是一个方案。假若用a因素占第一列,b因素占第二列,c因素占第三列,则:1号方案为a1b1c1,2号方案为a1b2c2,3号方案为a2b1c2,4号方案为a2b2c1,只要因素上例,各因素水平对号入座,方案就确定好了,有几个横行就几个因素方案。 再以l9(34)表为例,根据上表的理解,此表为4列9行的矩阵,该表最多安排4个因素,有9个实验方案,每个因素有3个水平,即每个纵列有1,2,3这3个数码。通过认真分析这两个正交表,发现,正交表排列有两个特点:1)每列每个因素中不同水平出现的次数相同如表1,每列1和2都出现2次.2)任意两个纵列,任意两个因素之间不同水平都要进行搭配,搭配的次数相同,也可以说是,任意两列把同一行的两个数字看成有序数字对时,所有可能的数字对出现次数相同。如表1,任意两个纵列,其横向形成的有序对(1,1)(1,2)(2,1)(2,2)出现次数相同,即1和2搭配均衡。2.3正交表的原理 如果按常规的网络设计方法(全面设计法)需要将所有因素和水平搭配。如果是3因素3水平的条件,需要做33=27次试验,相当于立方体上的27个节点,如图1,这种设计对于因素和水平之间的关系剖析的比较清楚,但如果是4因素3水平的试验,需进行34=81次,若是10因素3水平,责试验次数将达到310=59049.显然,这样的工作量是难以接受的,那么,能否用少量的试验在选定区内铺开而又保持全面试验的特点呢?正交试验就可以解决这个问题。 图中3个坐标轴代表3个因素,坐标轴上的点代表因素的水平,共27节点代表全面试验的27个方案,利用正交表l9(34)所安排的9个实验方案在图1中用黑点表示,由图可知,在立方体的每个面上恰有3个试验点,而且立方体每个线上也均有一个点,9个实验点均衡的分布于立方体内,每个实验均有很强代表性这,正交试验的均衡分散性,能够比较全面的反应优选区的情况。 第三章 正交试验的步骤3.1无交互作用的正交试验及其结构分析下面对具体实例工业合成氨来说明。表3(例1)水平a(反应温度。c)b反应时间c搅拌速度14601小时快24902小时中35203小时慢直观分析第一步 选表 本例是一个3水平的试验,因此选用ln(3k)正交表,本例共有3个因素,不考虑因素的交互作用,所以要选一张k3的表而l9(34)是满足条件的最小型ln(3k)的表,故选用它来安排实验。第二步 表头设计 本例不考虑因素之间的交互作用,只需将各因素分别填写在所选用的正交表的上方与序列号对应的位置上,一个因素占一列,不同因素占不同的列,就得到所谓表头设计: 表4因素 a b c 空列序号 1 2 3 4 未放置因素或交互作用的列称为空白列,空白列在正交设计的方差分析中也称为误差列,它有着重要作用,一般要求至少有一个空白列。 第三步 明确实验方案完成表头设计以后,只要把表中各列的数字“1”“2”“3”分别看成是该列所填因素在各个试验中的水平数,正交表的每一行就是一个实验方案,于是就得到9个实验方案,例如:第六号试验方案:a2b3c,.,这就是用490。c 压力300大气压,甲种催化剂组合进行试验。第四步 按规定的方案试验按正交表的各试验号中规定的水平组合进行试验,本例总共要进行9个实验,将实验结果(数据)y1y2.y9( 单位:吨)填写在表的最后一栏中。表5abc空白产量指标yi(t)1234123111123123123y1=1.72y2=1.82y3=1.80456222123231312y4=1.92y5=1.83y6=1.98789333123312231y7=1.59y8=1.60y9=1.81k1jk2jk3j5.345.735.005.235.255.595.305.555.225.365.395.32t=yi =16.07= =1.786k1jk2jk3j1.7801.9101.6671.7431.7501.8631.7671.8501.7401.7871.7971.773rj0.730.360.330.07因素主次a b c 优方案a2 b3 c2第五步 计算极差,确定因素的主次因素 引进记号: kij=第j列上水平号为i的各试验结果之和; kij=,其中s为第j列上水平号i出现的次数,kij表示第j列的因素水平取i时,进行试验所得到实验结果的平均值; rj=maxikij-minikij,rj称为第j列的极差或其所在因素的极差,rj也可以定义为rj=maxikij-minikij,对于例1,有 k11=k11(y1+y2+y3)=(1.72+1.82+1.83)=1.780;k21=k21=(y4+y5+y6)=(1.92+1.83+1.98)=1.910;k31=k31=(y7+y8+y9)=(1.59+1.60+1.80)=1.667; rj=maxk11,k21,k31-mink11,k21,k31=5.73-5.00=0.73.其他的kij,kij,rj的计算过程就不写出来了,他们的计算过程在表5上。 一般的说,各列的极差是不相等的,这说明个因素的水平改变对实验结果影响是不相同的,极差越大,说明这个因素水平的改变对实验结果的影响也越大,极差最大的那一列的因素,就是因素水平改变对实验结果影响最大的因素,也就是最主要的因素,对于例1: r1 r2 r3 r4. 因此,它的各因素的主次因素顺序为:主次 a b c 有时空白列的极差rj比所有因素的极差还要大,这说明因素之间存在不可忽略的交互作用,或者忽略了对实验结果有重要影响的其他因素,或者实验误差太大,需要具体分析。第六步 最优方案确定 挑选因素的最优水平与所要求的指标有关,若要求指标越大越好,责应选取使指标大的水平,即各列k1j,k2j,k3j中最大的的水平。例1的实验目标提高合成氨的产量,指标越大越好,所以应选取每个因素k1j,k2j,k3j最大的那个水平,由于k2ak1ak3a; k3bk1bk2b; k2ck1ck3c; 故得最优方案a2b3c2,即反应温度490。c,反应压力300大气压,乙种催化剂。我们通过分析计算得到最优方案a2b3c2,并不包含在正交表已做过的9个实验之中。这正体现正交表的优越性。但是,它是不是真正的最优方案呢?这必须通过进一步的理论计算来验证。方差分析1方差分析的必要性 正交试验的结果y1,y2.yn之间的差异是由两方面的原因引起的。一是因素水平不同以及交互作用对指标的影响。二是实验误差(包括未加控制的因素的变化)对指标的影响,如我们对同一号实验重复做几次所得的结果也不会完全一样,显然,这是由于实验误差引起的。极差分析法的方法的优点是简单、直观、计算量少,便于普遍及推广。对于生产过程的一般问题用极差分析法,能够得到很好解决,但是它不能实验过程中以及实验结果测定中必然误差的大小,因此方差分析法得到的实验结结论不够准确,而且,对影响实验结果的各因素的重要程度,也不能给出精确地数量估计,也不能提供一个标准来考察,判断因素对实验结果的影响是否显著。并且在有交互作用的试验中,方差法的误差更大(具体参见豁免水稻的例子)。方差分析是将因素水平不同(或交互作用)与实验误差两者对指标的影响区分开来的一种数学方法,其基本思想是:如果因子水平的变化所引起的实验结果的变动范围,落在误差所引起的实验结果的变动范围以内,或者相差不大,我们就可以判断这个因素水平变化并不引起实验结果显著变化。相反,我们可以判断这个因素水平会引起实验结果的显著变动。具体做法:将y1,y2.yn总的偏差平方和s总=(i-)2 分解为各因素的偏差平方和以及误差的偏差平方和,再分别计算个因素的平均偏差平方和记忆误差的平均偏差平方和,最后利用f比对各因素进行显著检验。2方差分析的步骤(1) 计算偏方差平方和 试验所得的9个数据y1,y2.yn,以及表示它们的平均值,以表示它们的平均值,以s总=(i-)2 它反映了实验结果的差异,s总大说明各次实验结果之间差异大,繁殖就小。 如何计算因素的偏差平方和?以因素a为例,sa可按下述方法计算,因为3.2有交互作用的正交实验及其结果的分析 前面讨论的正交试验设计和对实验结果的分析,都是在因素之间没有(或不考虑)的情况下进行得。实际上,在许多试验中,因素的交互作用不但存在,而且不能忽略。在这种情况下,许多因素的表头设计还必须另外借助两列间的交互作用表,许多正交表的后面都附有相应的交互作用表. 用正交表安排有交互作用的试验时,把交互作用看成一个新的因素,它要在正交表上的占有列,叫交互作用列。交互作用列不能随便安排在任意列上,应该通过查交互作用表来安排。例2 某科学实验小组,为了提高水稻产量,选取了对产量有影响的四个因素,每个因素取两个水平进行试验,以便确定生产表如下:表6品种a施磷肥(p)量(斤/亩)b施氮肥(n)量(斤/亩)c插值密度(寸*寸)d1a14015552a2601054 这是四个二水平因素的试验,可选用正交表l8(27). 按照上例的步骤,可得到以下正交表。 将因素a,b,c,d依次放到l8(27)的第1,2,4,7列上,这样安排的理由可在后面说明,第4,5,6列没有放因素,可以抹去,然后再把相应的水平按因素水平表中所确定的关系对号入座,就得到一张试验设计表。表7a b c d实验结果xi (斤/亩) yi=-1051 2 4 7 12345678 1(品种a1) 1(施p40斤/亩) 1(施n15斤/亩) 1 1 1 2(施n10斤/亩) 21 2(施p60斤/亩) 1 21 2 2 12(品种a2) 1 1 22 1 2 12 2 1 1 2 22 211251052107711301100950102010507.50.22.78.05.0-10-30 i i 18.4 2.7 12.2 2.5 -8 7.7 -1.8 7.9 g=10.4 i i 4.6 0.86 3.05 0.63 -2 1.93 -0.45 1.97r=大-小6.6 1.25 3.5 1.34 根据计划进行试验,并将试验测得的数据填入表7最后一栏,为了方便计算,将数据简化,每个数据每个都除以10在减去105。 与氨生产类似,在表7的下方分别计算各因素计算每个水平的产量之和i,i,平均产量i,i ,以及极差r。例如因素c在第四列,c的第1水平所对应数据之和是4=y1+y3+y5+y7=7.5+2.7+5-3=12.2,c的第一水平的平均值4=3.05.直观分析:(1) 比较表7中极差大小,各因素对试验指标影响主次为 主次 a ,c ,d ,b(2) 选取最佳水平组合a1b2c1d2,这恰好是第三号实验的条件。从表中可见第四号实验条件是最佳的,也就是算一算的好条件比不上直接看好的条件,这是由于因素之间存在影响较大的联合作用(也叫交互作用),前面讨论的实验以及实验结果的分析,都是在因素之间没有(或不考虑)交互作用的情况下进行的。实际上,在许多因素试验中,因素的交互作用不但存在,而且不能忽略,当我们忽略有主要影响的联合作用时,分析的结果就不大可靠了。在这种情况下,对多因素的正交试验的表头设计还必须借助两列间的交互作用表,许多正交表的后面都附有相应的交互作用表。 表8 交互作用表列列号号() 1 2 3 4 5 6 7 (1) 3 2 5 4 7 6 (2) 1 6 7 4 5 (3) 7 6 5 4 (4) 1 2 3 (5) 3 2 (6) 1 (7) 用正交表安排有交互作用的试验时把交互作用看成一个新的因素,它在正交表上的占有列,叫交互作用列。交互作用列不能随便安排在任意列上,应该通过查交互作用表来安排。从表8就可以查出正交表l8(27)中任何两列的交互作用列,具体查法是:第一列是带()的列号,从左往右水平的看,第二列号是不带括号的列号,从上往下垂直的看,交点处的数字就是交互作用列。例如,要查出第二列和第六列的交互作用列,先在表8的对角线上查出列号(2)与(6),然后从(2)向右横看,从6向下竖看交叉数字4就是它们的交互作用的列号,即是说用l8(27)安排实验时,如果因素a被安排在第二列,因素b被安排在第六列,那么交互作用因素就只能安排在第四列上,不能安排其他因素,以免发生效应之间的“混杂”。在分析实验结果时,仍然作为一个单独因素,同样计算它的极差,极差的大小反应a和b的交互作用的大小。那么我们就来看看有交互作用的上例具体应该怎么办吧。第一步 选表这是一个4因素2水平的试验,4个因素加上两个交互作用,,因此选用的2水平正交表至少要有六列,满足这种条件的以l8(27)为最小,因此选用正交表l8(27)安排实验。第二步 表头设计把因素a,b分别放在表l8(27)的第1,2列上,查表l8(27)两列间的相互作用表,可知交互作用列占用第3列,因此第3列不能安排 c因素,否则第3列的极差就分不清楚是因素 c的作用还是因素的。这便产生了效应混杂。先将因素c放在第4列,查l8(27)的两列间交互作用表,可知交互作用放在第6列,因此第6列不能安排别的因素,最后,d因素可以放在第五列或第七列,先安排在第五列上,于是第七列称为空白列。这样便不会得到有因素交互作用“混杂”的表头设计。如表9因素a b c d 空白列列号1 2 3 4 5 6 7第三步 明确试验方案完成了表头设计,只要把表l8(27)安排有因素的第1,1,4,5列上的数字“1”“2”分别看成是该列所安排的因素在各个试验中的水平数,从而正交表的每一行就确定一个实验方案,于是得到本例的8个实验方案。注意,在完成了表头设计以后,交互作用所在列与空白列一样,对确定实验方案不起任何作用,因为那些列的数字“1”“2”不代表任何实际水平。按正交表规定的试验方案进行试验,测定实验结果,实验方案与实验结果见表10第四步 计算极差,确定因素的主次顺序 按正交表的各试验号中规定的水平组合进行试验,本例总共要进行8个实验,将实验结果(数据)y1y2.y8填写在表的最后一栏中。 按氨生产的例子的极差计算方法,将计算结果填入表10中. 表10a b c 空白列 d实 验结 果 yi1 2 3 4 5 6 7xi123456781 1 1 1 1 1 11 1 1 2 2 2 21 2 2 1 1 2 21 2 2 2 2 1 12 1 2 1 2 1 22 1 2 2 1 2 12 2 1 1 2 2 12 2 1 2 1 1 211251052107711301100950102010507.50.22.78.05.0-10-30i i 18.4 2.7 4.7 12.2 20.5 2.5-8 7.7 5.7 -1.8 -10.5 7.9g=10.4 i i 4.6 0.68 1.18 3.05 5.13 0.63-2 1.93 1.43 -0.45 -2.53 1.97r=大-小6.6 1.25 0.25 3.5 7.66 1.34 本例是为了提高水稻的产量,和上例一样,极差越大,说明这个因素水平的改变对实验结果的影响也越大,极差最大的那一列的因素,就是因素水平改变对实验结果影响最大的因素,也就是最主要的因素。各因素对试验指标影响的主次可由比较各因素极差的大小得: 主次 ,a, c, d,b,第五步 最优方案确定和例1一样,本例要求指标越大越好,责应选取使指标大的水平,计算结果表明,交互作用极差很小,可忽略不计,而交互作用超过了b,c单独对指标的影响。因此在选取最佳水平组合时,应首先考虑的作用,一般是先算b,c之间所有水平搭配下实验数据的平均值。如表11 b1 b2 c1 c2 可见b1c1这一搭配最好。因此的最佳水平组合为a1b1c1d2这个实验条件,不包含在已做过的8个试验中,由于它考虑了因素之间的比较重要的交互作用,一般来说比较靠谱。参考文献:,1刘建平.陆元洪.编著.概率论与数理统计方法.华东理工大学出版设.2001 2孙荣恒编著.应用数理统计.北京:科学出版社.第二版2007 3张国权编著.应用概率统计.北京:科学出版社.2003 4中科院数学研究所数理统计组编著,正交实验法,北京人民教育出版社,1975.1-20 5上海中学教师进修教材,概率与数理统计.天津人民出版社 6庄楚强.吴亚森.编著.应用数理统计基础.华南理工大学出版社.2002 7郝拉娣.于化东. 正交表的使用分析j.2005,17(5):334-335 8赵书祥统计方法系列讲座(八) 实验设计(三).j北京大学体育报,1999.22(4)致 谢感谢指导教师朱艳伟的关心、指导和教诲!朱艳伟老师严以律己、宽以待人的崇高品质对学生将是永远的鞭策。朱艳伟老师敏锐的思维、民主而严谨的作风,使学生受益匪浅,终生难忘。作者在撰写毕业论文(设计)期间的工作自始至终都是在朱艳伟老师全面、具体的指导下进行的。感谢朱艳伟老师耐心的指导和教诲,每次都对我的论文提出宝贵的修改意见,特别是给予我精神上的鼓励和网络设备上的支持,使我的毕业论文在学校规定的时间内保质保量的完成。感谢我的学友和朋友们对我的关心和帮助。 18research on multi-classification algorithms of support vector machinexi lianggang
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年考试系统集成试题及答案
- 崭新系统分析师知识点试题及答案
- 系统分析师考试的关键能力提升与试题及答案
- 新课标试题及答案
- 建筑厂房安全管理制度
- 建筑公司用工管理制度
- 数据基础设施管理制度
- 电工实训室消防管理制度
- 中级社会工作者考试相关主题的全面分析及试题及答案
- ps考试题目模拟试题及答案
- 2025年高考历史五大热点主题知识复习汇编
- 肿瘤患者的人文关怀
- 2025-2030中国电子特气行业市场发展现状及竞争格局与投资前景研究报告
- 高寒环境露天矿电动无人驾驶矿用卡车:智能高效运输系统研发与应用
- 急性心肌梗死指南
- 无导线永久起搏器护理
- 计算机基础技能测试试题及答案
- 2025物业服务管理合同(合同范本)
- GB/T 13511.1-2025配装眼镜第1部分:单焦和多焦定配眼镜
- 2025年新媒体领导面试题及答案
- 2025统编办一年级下册道德与法治教案(精简版)
评论
0/150
提交评论