转SCI论文从入门到精通.doc_第1页
转SCI论文从入门到精通.doc_第2页
转SCI论文从入门到精通.doc_第3页
转SCI论文从入门到精通.doc_第4页
转SCI论文从入门到精通.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

转 SCI论文从入门到精通卡夫卡说,不用怀疑是否对你有用,先听了再说。于是我就转来了。最近很想,找个角落,潜心的研究一件东西,当宝贝一样。然后,老有所获。第一部分写论文前的准备工作一、先想先写最后做:1.做研究之前,必须想清楚:结果能不能发表?发表在哪里?2.先把文章大框写好,空出数据,等做完实验填完空就可以发了;正所谓心中有沟壑!3.在未搞清写什么、发哪里、自己研究与同类研究有何出色之处之前,就不要动手做!4.继续去看文献,去想;想不清楚就做还不如不做!5.要想这样做,就得先看文献!要知道如何把文章架起来、要知道别人是如何讨论的、要知道自己的数据是不是说明了与别人不同的东东或别人没有做过这个过程就是阅读文献及思考的过程,这些搞清楚了,写就简单了!6.要是先做事,做完发现别人做过,或无法用理论来解释,岂不是冤大头?二、如何科学选题:1.课题选择和国际接轨。想在国际核心期刊发表文献,就必须了解国际研究动态,选择与国际学术研究合拍的课题。由于多方面因素的影响,我国科学研究选题与国际先进水平还有一定距离。我国一家权威科研机构不久前在国内挑选了许多前沿领域的研究课题,准备参与国际合作,但到美国后发现近三分之二的课题已经不属前沿,在美国很少有人研究。在高校,一些教师治学严谨、基础扎实,但科研成果不突出,重要原因就是不重视有关领域学术动态,不能选得合适的课题。2.课题要有可发展性。课题可发展性对高水平论文的持续产出具有极大作用。中国科技大学范洪义另辟蹊径,发展了诺贝尔奖得主狄拉克(Dirac)奠定的量子论的符号法,系统地建立了有序算符内的积分理论,1998年有24篇论文被SCI收录;他对自己论文高产的解释是,研究具有开创性,突破一点以后就可以向纵深发展,使研究工作自成系列、成面成片。我院被SCI收录论文最多的杨新民老师从事凸性理论研究,该理论兴起于20世纪70年代,90年代进入高峰。作为新兴研究领域,该理论本身有许多尚待研究之处,同时该理论也可用来解决最优化方面的问题。反之,有人由于所接触的问题已处于该研究分支的末端,即使在该点上有所突破,也难持续发展。3.借助工具选题:查阅有关领域的检索工具,这些工具各高校都有;了解SCI收录期刊所反映的科技动态,ISI期刊信息可从查获,也可从SCI印刷版每期A、D分册的来源出版物目录(Lists of Source Publications)查找,还可从ISI引用期刊报告(Journal Citation Reports,简称JCR)了解期刊信息,该文献有印刷版、网络版(JCR on the Web)和光盘版(JCR on CD-ROM);利用ISI提供的选题工具帮助,例如,能对正在开展的工作进行量化分析以保证用户科学研究同科学发展趋向一致的(Essential Science Indicators),介绍有关最杰出人物研究状况、有关领域研究热点和发展趋向的(ISI Highly C);利用网上数据库了解国际学术研究动态叹。它引入了一个接受概率p。如果新的点(设为pn)的目标函数f(pn)更好,则p=1,表示选取新点;否则,接受概率p是当前点(设为pc)的目标函数f(pc),新点的目标函数f(pn)以及另一个控制参数温度T的函数。也就是说,模拟退火没有像局部搜索那样每次都贪婪地寻找比现在好的点,目标函数差一点的点也有可能接受进来。随着算法的执行,系统温度T逐渐降低,最后终止于某个低温,在该温度下,系统不再接受变化。模拟退火的典型特征是除了接受目标函数的改进外,还接受一个衰减极限,当T较大时,接受较大的衰减,当T逐渐变小时,接受较小的衰减,当T为0时,就不再接受衰减。这一特征意味着模拟退火与局部搜索相反,它能避开局部极小,并且还保持了局部搜索的通用性和简单性。在物理上,先加热,让分子间互相碰撞,变成无序状态,内能加大,然后降温,最后的分子次序反而会更有序,内能比没有加热前更小。就像那只兔子,它喝醉后,对比较近的山峰视而不见,迷迷糊糊地跳一大圈子,反而更有可能找到珠峰。值得注意的是,当T为0时,模拟退火就成为局部搜索的一个特例。模拟退火的伪码表达:procedure simulated annealing begin t:=0;initialize temperature Tselect acurrent string vc at random;evaluate vc;repeat repeat select anew string vn in the neighborhood of vc;(1)if f(vc)f(vn)then vc:=vn;else if random0,1exp(f(vn)-f(vc)/T)(2)then vc:=vn;until(termination-condition)(3)T:=g(T,t);(4)T:=t+1;until(stop-criterion)(5)end;上面的程序中,关键的是(1)新状态产生函数,(2)新状态接受函数,(3)抽样稳定准则,(4)退温函数,(5)退火结束准则(简称三函数两准则)是直接影响优化结果的主要环节。虽然实验结果证明初始值对于最后的结果没有影响,但是初温越高,得到高质量解的概率越大。所以,应该尽量选取比较高的初温。上面关键环节的选取策略:(1)状态产生函数:候选解由当前解的邻域函数决定,可以取互换,插入,逆序等操作产生,然后根据概率分布方式选取新的解,概率可以取均匀分布、正态分布、高斯分布、柯西分布等。(2)状态接受函数:这个环节最关键,但是,实验表明,何种接受函数对于最后结果影响不大。所以,一般选取min1,exp(f(vn)-f(vc)/T)。(3)抽样稳定准则:一般常用的有:检验目标函数的均值是否稳定;连续若干步的目标值变化较小;规定一定的步数;(4)退温函数:如果要求温度必须按照一定的比率下降,SA算法可以采用,但是温度下降很慢;快速SA中,一般采用。目前,经常用的是,是一个不断变化的值。(5)退火结束准则:一般有:设置终止温度;设置迭代次数;搜索到的最优值连续多次保持不变;检验系统熵是否稳定。为了保证有比较优的解,算法往往采取慢降温、多抽样、以及把终止温度设的比较低等方式,导致算法运行时间比较长,这也是模拟退火的最大缺点。人喝醉了酒办起事来都不利索,何况兔子?遗传算法(Genetic Algorithm,GA)物竞天择,适者生存,是进化论的基本思想。遗传算法就是模拟自然界想做的事。遗传算法可以很好地用于优化问题,若把它看作对自然过程高度理想化的模拟,更能显出它本身的优雅-虽然生存竞争是残酷的。遗传算法以一种群体中的所有个体为对象,并利用随机化技术指导对一个被编码的参数空间进行高效搜索。其中,选择、交叉和变异构成了遗传算法的遗传操作;参数编码、初始群体的设定、适应度函数的设计、遗传操作设计、控制参数设定五个要素组成了遗传算法的核心内容。作为一种新的全局优化搜索算法,遗传算法以其简单通用、健壮性强、适于并行处理以及高效、实用等显著特点,在各个领域得到了广泛应用,取得了良好效果,并逐渐成为重要的智能算法之一。遗传算法的伪码:procedure genetic algorithm begin initialize agroup and evaluate the fitness value;(1)while not convergent(2)begin select;(3)if random0,1pc then crossover;(4)if random(0,1)pm then mutation;(5)end;end上述程序中有五个重要的环节:(1)编码和初始群体的生成:GA在进行搜索之前先将解空间的解数据表示成遗传空间的基因型串结构数据,这些串结构数据的不同组合便构成了不同的点。然后随机产生N个初始串结构数据,每个串结构数据称为一个个体,N个体构成了一个群体。GA以这N个串结构数据作为初始点开始迭代。比如,旅行商问题中,可以把商人走过的路径进行编码,也可以对整个图矩阵进行编码。编码方式依赖于问题怎样描述比较好解决。初始群体也应该选取适当,如果选取的过小则杂交优势不明显,算法性能很差(数量上占了优势的老鼠进化能力比老虎强),群体选取太大则计算量太大。(2)检查算法收敛准则是否满足,控制算法是否结束。可以采用判断与最优解的适配度或者定一个迭代次数来达到。(3)适应性值评估检测和选择:适应性函数表明个体或解的优劣性,在程序的开始也应该评价适应性,以便和以后的做比较。不同的问题,适应性函数的定义方式也不同。根据适应性的好坏,进行选择。选择的目的是为了从当前群体中选出优良的个体,使它们有机会作为父代为下一代繁殖子孙。遗传算法通过选择过程体现这一思想,进行选择的原则是适应性强的个体为下一代贡献一个或多个后代的概率大。选择实现了达尔文的适者生存原则。(4)杂交:按照杂交概率(pc)进行杂交。杂交操作是遗传算法中最主要的遗传操作。通过杂交操作可以得到新一代个体,新个体组合了其父辈个体的特性。杂交体现了信息交换的思想。可以选定一个点对染色体串进行互换,插入,逆序等杂交,也可以随机选取几个点杂交。杂交概率如果太大,种群更新快,但是高适应性的个体很容易被淹没,概率小了搜索会停滞。(5)变异:按照变异概率(pm)进行变异。变异首先在群体中随机选择一个个体,对于选中的个体以一定的概率随机地改变串结构数据中某个串的值。同生物界一样,GA中变异发生的概率很低。变异为新个体的产生提供了机会。变异可以防止有效基因的缺损造成的进化停滞。比较低的变异概率就已经可以让基因不断变更,太大了会陷入随机搜索。想一下,生物界每一代都和上一代差距很大,会是怎样的可怕情形。就像自然界的变异适和任何物种一样,对变量进行了编码的遗传算法没有考虑函数本身是否可导,是否连续等性质,所以适用性很强;并且,它开始就对一个种群进行操作,隐含了并行性,也容易找到全局最优解。禁忌搜索算法(Tabu Search,TS)为了找到全局最优解,就不应该执着于某一个特定的区域。局部搜索的缺点就是太贪婪地对某一个局部区域以及其邻域搜索,导致一叶障目,不见泰山。禁忌搜索就是对于找到的一部分局部最优解,有意识地避开它(但不是完全隔绝),从而获得更多的搜索区间。兔子们找到了泰山,它们之中的一只就会留守在这里,其他的再去别的地方寻找。就这样,一大圈后,把找到的几个山峰一比较,珠穆朗玛峰脱颖而出。当兔子们再寻找的时候,一般地会有意识地避开泰山,因为他们知道,这里已经找过,并且有一只兔子在那里看着了。这就是禁忌搜索中禁忌表(tabu list)的含义。那只留在泰山的兔子一般不会就安家在那里了,它会在一定时间后重新回到找最高峰的大军,因为这个时候已经有了许多新的消息,泰山毕竟也有一个不错的高度,需要重新考虑,这个归队时间,在禁忌搜索里面叫做禁忌长度(tabu length);如果在搜索的过程中,留守泰山的兔子还没有归队,但是找到的地方全是华北平原等比较低的地方,兔子们就不得不再次考虑选中泰山,也就是说,当一个有兔子留守的地方优越性太突出,超过了best to far的状态,就可以不顾及有没有兔子留守,都把这个地方考虑进来,这就叫特赦准则(aspiration criterion)。这三个概念是禁忌搜索和一般搜索准则最不同的地方,算法的优化也关键在这里。伪码表达:procedure tabu search;begin initialize astring vc at random,clear up the tabu list;cur:=vc;repeat select anew string vn in the neighborhood of vc;if va best_to_far thenva is astring in the tabu listbegin cur:=va;let va take place of the oldest string in the tabu list;best_to_far:=va;end else begin cur:=vn;let vn take place of the oldest string in the tabu list;end;until(termination-condition);end;以上程序中有关键的几点:(1)禁忌对象:可以选取当前的值(cur)作为禁忌对象放进tabu list,也可以把和当然值在同一等高线上的都放进tabu list。(2)为了降低计算量,禁忌长度和禁忌表的集合不宜太大,但是禁忌长度太小容易循环搜索,禁忌表太小容易陷入局部极优解。(3)上述程序段中对best_to_far的操作是直接赋值为最优的解禁候选解,但是有时候会出现没有大于best_to_far的,候选解也全部被禁的死锁状态,这个时候,就应该对候选解中最佳的进行解禁,以能够继续下去。(4)终止准则:和模拟退火,遗传算法差不多,常用的有:给定一个迭代步数;设定与估计的最优解的距离小于某个范围时,就终止搜索;当与最优解的距离连续若干步保持不变时,终止搜索;禁忌搜索是对人类思维过程本身的一种模拟,它通过对一些局部最优解的禁忌(也可以说是记忆)达到接纳一部分较差解,从而跳出局部搜索的目的。人工神经网络人工神经网络(Artificial Neural Network,ANN)神经网络从名字就知道是对人脑的模拟。它的神经元结构,它的构成与作用方式都是在模仿人脑,但是也仅仅是粗糙的模仿,远没有达到完美的地步。和冯诺依曼机不同,神经网络计算非数字,非精确,高度并行,并且有自学习功能。生命科学中,神经细胞一般称作神经元,它是整个神经结构的最基本单位。每个神经细胞就像一条胳膊,其中像手掌的地方含有细胞核,称作细胞体,像手指的称作树突,是信息的输入通路,像手臂的称作轴突,是信息的输出通路;神经元之间错综复杂地连在一起,互相之间传递信号,而传递的信号可以导致神经元电位的变化,一旦电位高出一定值,就会引起神经元的激发,此神经元就会通过轴突传出电信号。而如果要用计算机模仿生物神经,就需要人工的神经网络有三个要素:(1)形式定义人工神经元;(2)给出人工神经元的连接方式,或者说给出网络结构;(3)给出人工神经元之间信号强度的定义。历史上第一个人工神经网络模型称作M-P模型,非常简单:其中,表示神经元i在t时刻的状态,为1表示激发态,为0表示抑制态;是神经元i和j之间的连接强度;表示神经元i的阈值,超过这个值神经元才能激发。这个模型是最简单的神经元模型。但是功能已经非常强大:此模型的发明人McCulloch和Pitts已经证明,不考虑速度和实现的复杂性,它可以完成当前数字计算机的任何工作。以上这个M-P模型仅仅是一层的网络,如果从对一个平面进行分割的方面来考虑的话,M-P网络只能把一个平面分成个半平面,却不能够选取特定的一部分。而解决的办法就是多层前向网路。为了让这种网络有合适的权值,必须给网络一定的激励,让它自己学习,调整。一种方法称作向后传播算法(Back Propagation,BP),其基本思想是考察最后输出解和理想解的差异,调整权值,并把这种调整从输出层开始向后推演,经过中间层,达到输入层。可见,神经网络是通过学习来达到解决问题的目的,学习没有改变单个神经元的结构和工作方式,单个神经元的特性和要解决的问题之间也没有直接联系,这里学习的作用是根据神经元之间激励与抑制的关系,改变它们的作用强度。学习样本中的任何样品的信息都包含在网络的每个权值之中。BP算法中有考察输出解和理想解差异的过程,假设差距为w,则调整权值的目的就是为了使得w最小化。这就又包含了前文所说的最小值问题。一般的BP算法采用的是局部搜索,比如最速下降法,牛顿法等,当然如果想要得到全局最优解,可以采用模拟退火,遗传算法等。当前向网络采用模拟退火算法作为学习方法的时候,一般成为波尔兹曼网络,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论