




已阅读5页,还剩75页未读, 继续免费阅读
(物理化学专业论文)人工神经网络在人类snps的预报和古陶瓷鉴定中的应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
上海大学硕上学位论文 摘要 人类单核苷酸多态性( s n p s ) 国际研究计划和中华民族核苷酸多态性项 目已经进行了两年多时间,由于研究工作耗资巨大,使得这两个项目都进 展缓慢。目前人类单核苷酸多态性( s n p s ) 研究主要都是依靠生物实验来确 定,借助计算机和数学算法来预报人类单核苷酸多态。眭( s n p s ) 的报道还很 少见,这是生物信息学领域的一个难题。 本工作在大量文献分析的基础上,试用统计模式识别和人工神经网络 算法来预报人类单核苷酸多态。t i ( s n p s ) ,通过构建适当的数学模型,预报 人类单核苷酸多态。眭( s n p s ) 的准确率达到了7 3 ,在生物实验中参考数学 模型预报结果,可以节省大量研究资源。 古陶瓷断源、断代研究中主要应用多元统计分析方法,近些年来统计 模式识别方法逐步被应用于古陶瓷研究中。本论文将人工神经网络算法和 支持向量机算法应用于古陶瓷研究中,效果良好,得到了国内外古陶瓷研 究人员的广泛关注,在古陶瓷国际研讨会上发表了多篇论文,其中有关“景 德镇青花瓷的智能鉴定方法”的研究论文作为古陶瓷国际研讨会的特邀报 告,将在大会上宣讲。 本工作中同时讨论了在古陶瓷研究中,应用统计模式识别、人工神经 网络和支持向量机等算法的优点和缺点,为古陶瓷研究中更广泛地应用这 些算法奠定基础,为古陶瓷研究提供新方法。 关键词:人工神经网络( a n n ) 、统计模式识别、支持向量机( s v m ) 、单核 苷酸多态。性( s n p s ) 、古陶瓷 上海大学硕士学位论文 a b s t r a c t t h eh u m a ns i n g l en u c l e o t i d ep o l y m o r p h i s m s ( s n p s ) i n t e r n a t i o n a lr e s e a r c h p r o j e c ta n dt h ec h i n e s es n p sr e s e a r c hp r o j e c th a v eb e e nc a r r i e do u tf o rm o r e t h a nt w oy e a r s t h ep r o g r e s so ft h et w op r o j e c t sw a ss l o wd u et ot h eh u g e r e s o u r c e sd e m a n d p r e s e n t l y , t h ei d e n t i f i c a t i o no ft h eh u m a ns n p sd e p e n d s m a i n l yo nb i o l o g i ce x p e r i m e n t s r e p o t so nt h ep r e d i c t i o no fh u m a ns n p s b a s e do nc o m p u t e ra n dm a t h e m a t i c a ll o g a r i t h m sa r er a r e t h i si sad i f f i c u l t p r o b l e mi nt h eb i o i n f o r m a t i c sf i e l d b a s e do nt h ea n a l y s i so fl i t e r a t u r e s ,s t a t i s t i c a lp a t t e mr e c o g n i t i o na n d a r t i f i c i a ln e u r a ln e t w o r k ( a n n ) w e r ea p p l i e dt op r e d i c tt h eh u m a ns n ps i t e s w i t ht h ep r o p e rm a t h e m a t i c a lm o d e lc o n s t r u c t e d ,t h ep r e d i c t i o na c c u r a c yo ft h e h u m a ns n p sr e a c h e dt o7 3 w i t ht h eh e l po ft h e s em a t h e m a t i c a lm o d e l s ,g r e a t s a v i n g so fr e s o u r c e sc o u l db ea c h i e v e dw h e nd e s i g n i n gt h es n pi d e n t i f i c a t i o n e x p e r i m e n t s t h ep r i m a r ym e t h o df o rt h ei d e n t i f i c a t i o no fa n c i e n tc e r a m i ci ss t a t i s t i c a l m u l t i v a r i a n ta n a l y s i s i nr e c e n ty e a r s ,t h ea p p l i c a t i o no fs t a t i s t i c a lp a t t e r n r e c o g n i t i o ni sg e t t i n gi n t ot h i sf i e l d i nt h i sp a p e r , a r t i f i c i a ln e u r a ln e t w o r k ( a n n ) a n ds u p p o r tv e c t o rm a e h i n e ( s v m ) w e r ea p p l i e di nt h i sf i e l da n do b t a i n e dg o o d r e s u l t s n a t i o n a la n di n t e m a t i o n a la n c i e n tc e r a m i cr e s e a r c h e r sh a v ep a i d a t t e n t i o nt oo u r a p p r o a c h s e v e r a lp a p e r s w e r ep u b l i s h e do nt h e2 0 0 5 i n t e m a t i o n a ls y m p o s i u mo na n c i e n tc e r a m i c s o n eo ft h e s ep a p e r s ,t h e i n t e l l i g e n ti d e n t i f i c a t i o no f t h ej i n g d e z h e nq i n g h u ac e r a m i c ,w i l lb ed e c l a r e do n t h es y m p o s i u ma sas p e c i a l l yi n v i t e dr e p o r t i n g t h i sp a p e ra l s od i s c u s s e st h ep r o sa n dc o n so fa p p l y i n ga n n ,s v ma n d s t a t i s t i c a lp a t t e mr e c o g n i t i o ni nt h ea n c i e n tc e r a m i cr e s e a r c hf m d t oe s t a b l i s h v i r 海大学预士学位论文 t h ef o u n d a t i o nf o rt h ew i d e ra p p l i c a t i o no ft h ea r i t h m e t i ci n t h i sf i e l d i to f f e r s n e wm e t h o d si nt h ea n c i e n tc e r a m i cr e s e a r c hf i e l d k e y w o r d s :a r t i f i c i a l n e u r a l n e t w o r k ( a n n ) ,s t a t i s t i c a lp a u e mr e c o g n i t i o n , s u p p o r tv e c t o rm a c h i n e ( s v m ) ,s i n g l en u c l e o t i d ep o l y m o r p h i s m s ( s n p s ) ,a n c i e n t c e r a m i c v i i 上海大学硕十学位论文 原创性声明 本人声明:所呈交的论文是本人在导师指导下进行的研究工作。 除了文中特别加以标注和致谢的地方外,论文中不包含其他人已发 表或撰写过的研究成果。参与同一工作的其他同志对本研究所做的 任何贡献均己在论文中作了明确的说明并表示了谢意。 签名:望醺日期:趟! 型 本论文使用授权说明 本人完全了解上海大学有关保留、使用学位论文的规定,即: 学校有权保留论文及送交论文复印件,允许论文被查阅和借阅;学 校可以公布论文的全部或部分内容。 ( 保密的论文在解密后应遵守此规定) 期:乒“,。f2 日 建 每一 聋 上海大学硕士学位沦文 第一章绪论 1 1s n p s 研究的意义、研究进展 单核苷酸多态l 生( s i n g l en u c l e o t i d ep o l y m o r p h i s m s ,s n p s ) 是决定人类千差万 别的物质基础,也是决定未来药物开发、医学诊断、治疗发展水平的决定性因素 之一。随着人类基因组计封j ( h u m a ng e n o m ep r o j e c t , i - i g p ) 的完成,以及国际人类 基因组单体型图计划( 简称h a p m a p 计划) 的启动实旋,s n p s 方面的研究成为国 际热点,越来越多的基因多态性与疾病的关系被揭示。如,a g t 、a c e 两个基 因的多态性与高血压病之间的关系已经得到心脑血管学术界的公认,k c n q l 与 房颤有必然的联系。而基因中的s n p s 占所有己知基因多态性的9 0 以上,研究 基因多态性,必先研究基因s n p s 。 1 1 1 人类基因组的单核苷酸多态性( s n p s ) s n p s 是指在基因组水平上由于单个核苷酸的变异而产生的一种d n a 序列 多态性。这种单核苷酸变异包括单碱基的转换、颠换、插入和缺失。严格来讲, s n p s 要求变异在人群中出现的频率不小于1 ,因此单碱基的插入和缺失并不是 真正意义上的s n p s l l l 。遗传密码有四种碱基组成,但通常s n p s 只是一种二等位 基厌q ( b i a l l e l i c ) 或二态的遗传变异,在该位置只存在两种不同的碱基,三等位或四 等位基因的s n p s 很少见,因此,s n p s 也被简单地称为双等位基因标记。单个 碱基的变异可能是转换( a g ,c t ) ,也可能是颠换( c - - + g ,a t ) ,如果四种 碱基随机突变,s n p s 中的颠换应该是转换的2 倍,但实际上四种碱基的突变机 会并不均等。研究表明,发生在同型碱基之间的转换占单碱基变异的7 0 1 ,而 发生在嘌呤与嘧啶之间的颠换约为2 9 1 【2 1 。s n p s 在c g 序列上出现最为频繁, 且多是发生c t 转换,原因是c g 中的c 即胞嘧啶是甲基化的,它能自发地脱 氨基而替换为胸腺嘧啶【6 j 。 s n p s 在基因组内可以被人为地划分为两种形式:一是主要分布在基因编码 上海大学硕士学位论史 区( c o d i n gr e g i o n ) 的功能性突变,又被称为e s n p s ;二是处于非编码区的大量单 碱基变异。由于选择压力的原因,s n p s 在单个基因或整个基因组中的分布是不 均匀的n is n p s 的数目在非编码区要远远大于编码区。据h a l u s h k a 推测,人类 基因组1 0 0 万个s n p s 中,大约5 0 万个左右在非编码区,2 4 4 0 万个在编码区 碍】,2 0 3 0 引起蛋白质编码序列改变的非同义编码s n p s ( n o n - s y n o n y m o u s s n p s ,n s s n p s ) 会导致蛋白质功能的变化 9 1 1 i 。 从对生物的遗传性状的影响上来看,c s n p s 又可分为2 种:一种是同义 c s n p s ( s y n o n y m o u sc s n p s ) ,即s n p s 所致的编码序列的改变并不影响其所翻译 的蛋白质的氨基酸序列,突变碱基与未突变碱基的含义相同;另一种是非同义 c s n p s ( n o n s y n o n y m o u sc s n p s ) ,指碱基序列的改变可使以其为蓝本翻译的蛋白 质序列发生改变,从而影响了蛋白质的功能,这种改变常是导致生物性状改变 的直接原因。e s n p s 中约有一半为非同义c s n p s 。 1 1 2s n p s 研究的意义 s n p s 的普遍存在使其成为最有用的疾病相关的研究手段。一个s n p s 的频 率越高,它就越古老,所以高频s n p s 大致上揭示了人类群体的多样性,这种 多样性信息可用于人类进化的研究。但在同一条染色体上,单核苷酸多样性的 分布极不均匀,这与染色体各部分序列的突变率不同有关,基因组某些区域的 多样性比平均水平要高很多或是低很多。 根据最近的研究结果发现人类基因组中大约存在1 4 0 万至3 1 0 万个s n p s , 其平均密度为l k b 1 2 】。在基因组连锁分析中,s n p s 己成为比其它类别的f 芋列变 异( 比如微卫星位点) 更为理想的遗传标记,并可通过s n p s 观察人类基因组中的 连锁不平衡水平【1 3 】。连锁不平衡是一种用于衡量基因组序列中特异的等位基因组 合( 单倍型,h a p l o t y p e ) 的方法,后者来自于在进化过程中被保留下来的共同原始 祖先1 3 1 。通过s n p s 的连锁不平衡研究,不仅有助于人们理解人类进化的规律, 还可以定位疾病相关的遗传位点【1 4 ,为最终发现致病基因提供重要线索。 上海大学碘十学位论文 s n p s 作为第三代遗传标记,只有两种等位型,变异程度不如微卫星,但由 于它在基因组中数量巨大,分布频密,具有较微卫星更稳定的遗传特性;s n p s 的二态性也使得其在筛选过程中,只需要通过简单的+ 分析来决定基因分型, 不用像其他遗传标记那样需要分析片段的长度,更容易实现分析的自动化。 1 1 3 疾病基因的定位 寻找与疾病表型相关的遗传位点并非是一项容易的工作,尤其是对于复杂 性状疾病。这些疾病都由多种易感因子积累其影响从而致病,其中包括遗传因 素和环境因素。与疾病表型相关的每一个单独的疾病易感位点或因素的确定是 一项极富挑战性的工作。虽然定位克隆已经成功地被用于确定引起单基因疾病 的遗传致疾位点,但是遗传作图在复杂性状疾病的多位点分析中存在很大的局 限性,尤其当位点对于疾病表型的贡献较小的时候,困难就更为突出 15 1 。 随着几百万个s n p s 的发现,已经使确定复杂性状这一严峻的挑战成为一 种可能。s n p s 一般平均密度为1 9 k b ,有6 3 的区域至少在5 k b 中存在一个 s n p l l6 1 ,s n p s 在人类基因组中的广泛分布使其成为理想的候选标记。虽然以往 在我们感兴趣区域中发现多态性从而确定与性状相关的遗传位点能起到一定的 效果,但现在广泛分布的s n p s 为我们提供了更为有效的标记【1 7 】,而人类s n p s 图谱的主要作用是分析个体基因多态性和多基因复杂疾病的关系。简单地说, 基因序列的这种变异,决定了人们对疾病的易感性和免疫性不同,疾病的发病 年龄和严重程度不同,机体对治疗的反应等也不同【l “。 1 1 4s n p s 的研究进展 目前,s n p s 研究是人类基因组研究的一个热点。1 9 9 8 年w a n g 等”8 1 首先 报道了根据s n p s 技术建立的人类基因图谱,获得的s n p s 平均距离为2 c m ,这 些s n p s 数据可由公众免费获得。另外,美国、日本及欧洲些国家等的政府 科研机构及部分私人公司研究开发的s n p s 图谱也将免费向公众提供。近年来, 储存在公共数据库里的s n p s 数量正在以几何级数迅速增长。到1 9 9 9 年4 月, 上海大学硕上学位论文 s n p s 作为第三代遗传标记,只有两种等位型,变异程度不如微卫星,但由 于它在基因组中数量巨大,分布频密,具有较微卫星更稳定的遗传特性;s n p s 的二态性也使得其在筛选过程中,只需要通过简单的+ 分析来决定基因分犁, 不用像其他遗传标记那样需要分析片段的长度,更容易实现分析的自动化。 1 1 3 疾病基因的定位 寻找与疾病表型相关的遗传位点并非是一项容易的工作,尤其是埘于复杂 性状疾病。这些疾病都由多种易感因子积累其影响从而致病,其中包括遗传因 素和环境因素。与疾病表型相关的每一个单独的疾病易感位点或因素的确定是 一项极富挑战性的工作。虽然定位克隆已经成功地被用于确定引起单基因疾病 的遗传致疾位点,但是遗传作图在复杂性状疾病的多位点分析中存在很大的局 限性,尤其当位点对于疾病表犁的贡献较小的时候,困难就更为突出1 15 。 随着儿百万个s n - p s 的发现,已经使确定复杂性状这一严峻的挑掖成为一 种可能。s n p s 一般平均密度为1 9 k b ,有6 3 的区域至少在5 k b 中存在一个 s n p “】,s n p s 在人类基因组中的广泛分布使其成为理想的候选标记。虽然以往 在我们感兴趣区域中发现多态性从而确定与性状相关的遗传位点能起到一定的 效果,但现在广泛分布的s n p s 为我们提供了更为有效的标记【1 7 】,而人类s n p s 图谱的主要作用是分析个体基因多态性和多基因复杂疾病的关系。简单地说, 基因序列的这种变异,决定了人们对疾病的易感性和免疫性不同,疾病的发病 年龄和严重程度不同,机体对治疗的反应等也不同【。 1 1 4s n p s 的研究进展 目前,s n p s 研究是人类基因组研究的一个热点。1 9 9 8 年w a n g 等 18 首先 报道了根据s n p s 技术建立的人类基因图谱,获得的s n p s 平均距离为2 c m ,这 些s n p s 数据可由公众免费获得。另外,美国、e t 本及欧洲一些国家等的政府 科研机构及部分私人公司研究开发的s n p s 图谱也将免费向公众提供。近年来, 储存在公共数据库罩的s n p s 数量正在以几何级数迅速增长。到1 9 9 9 年4 月, 储存在公共数据库里的s n p s 数量正在以几何级数迅速增长。到1 9 9 9 年4 月, 上海大学碘十学位论文 s n p s 作为第三代遗传标记,只有两种等位型,变异程度不如微卫星,但由 于它在基因组中数量巨大,分布频密,具有较微卫星更稳定的遗传特性;s n p s 的二态性也使得其在筛选过程中,只需要通过简单的+ 分析来决定基因分型, 不用像其他遗传标记那样需要分析片段的长度,更容易实现分析的自动化。 1 1 3 疾病基因的定位 寻找与疾病表型相关的遗传位点并非是一项容易的工作,尤其是对于复杂 性状疾病。这些疾病都由多种易感因子积累其影响从而致病,其中包括遗传因 素和环境因素。与疾病表型相关的每一个单独的疾病易感位点或因素的确定是 一项极富挑战性的工作。虽然定位克隆已经成功地被用于确定引起单基因疾病 的遗传致疾位点,但是遗传作图在复杂性状疾病的多位点分析中存在很大的局 限性,尤其当位点对于疾病表型的贡献较小的时候,困难就更为突出 15 1 。 随着几百万个s n p s 的发现,已经使确定复杂性状这一严峻的挑战成为一 种可能。s n p s 一般平均密度为1 9 k b ,有6 3 的区域至少在5 k b 中存在一个 s n p l l6 1 ,s n p s 在人类基因组中的广泛分布使其成为理想的候选标记。虽然以往 在我们感兴趣区域中发现多态性从而确定与性状相关的遗传位点能起到一定的 效果,但现在广泛分布的s n p s 为我们提供了更为有效的标记【1 7 】,而人类s n p s 图谱的主要作用是分析个体基因多态性和多基因复杂疾病的关系。简单地说, 基因序列的这种变异,决定了人们对疾病的易感性和免疫性不同,疾病的发病 年龄和严重程度不同,机体对治疗的反应等也不同【l “。 1 1 4s n p s 的研究进展 目前,s n p s 研究是人类基因组研究的一个热点。1 9 9 8 年w a n g 等”8 1 首先 报道了根据s n p s 技术建立的人类基因图谱,获得的s n p s 平均距离为2 c m ,这 些s n p s 数据可由公众免费获得。另外,美国、日本及欧洲些国家等的政府 科研机构及部分私人公司研究开发的s n p s 图谱也将免费向公众提供。近年来, 储存在公共数据库里的s n p s 数量正在以几何级数迅速增长。到1 9 9 9 年4 月, 卜海大学硕士学位论史 总共才分析了7 0 0 0 个s n p s ,其中e s n p s 占半数;而到了当年1 2 月1 6 日,仅 美国国立生物技术信息中心( n c b i ,h t t p :w w w n c h i n l m n i h 。g o v s n p ) 的s n p s 数 据库就己收录了2 1 1 7 2 条s n p s ;至2 0 0 1 年8 月,该数据库已经取得了2 9 9 6 7 7 3 个s n p s 数据,其中非冗余的s n p s 共1 6 5 万个1 19 】;德国的h g b a s 网站 ( h t t p :h g b a s c g r k i s e i ) 至02 0 0 1 年7 月也已收录了5 3 1 8 5 0 个s n p s 数据【2 0 1 。另外, 日本建立了j s t ( h t t p :s n p i m s u 2 t o l k y o a c j p ) s n p s 数据库。国内也于2 0 0 1 年底 启动了“8 6 3 ”计划,进行中华民族基因组s n p s 系统目录的构建与研究;应用 变性高效液相色谱( d h p l c 泼术对冠心病患者的脂蛋白脂酶基因的s n p s 进行 了筛查1 2 ”,复旦大学遗传所报道了汉族人群中2 肾上腺素能受体基因的 s n p s 22 1 ,上海人类基因组研究中心将d h p l c 与直接测序法在s n p s 检测中的 应用进行了比较研究,证明前者可有效地筛检人类基因组中的s n p s 2 3 1 。 1 2 古陶瓷研究进展 从1 9 8 2 年古陶瓷会议至今已有2 0 余年,古陶瓷科学技术研究曾经历了辉 煌和低沉,从当初简单的化学组成分析和工艺性能测试,到今日各种基于核技 术的分析手段在古陶瓷研究中的广泛应用,其重要的课题之一就是古陶瓷的断 源、断代和古陶瓷的鉴定。 1 2 1 古陶瓷的结构、组成和性能 古陶瓷研究的核心内容包括成分、结构和性能三个方面。最初的研究手段 比较简单,只有化学分析方法测试样品的主量化学成分、光学显微镜观测样品 的亚显微结构,以及烧成温度、膨胀系数、吸水率等工艺参数的测试。 随着各种电子显微镜的普及,古陶瓷结构研究率先取得突破。电子显微镜 应用于古陶瓷结构分析,使分析尺度从亚显微结构进入到显微结构,能够获得 瓷釉中析晶和分相的清晰照片。然而多数古陶瓷研究论文只给出瓷釉或瓷胎的 电子显微镜照片,粗略地说明从照片中观察的显微结构。 上海大学硕士学位论文 最初在铁红釉中发现的瓷釉分相结构的深入探讨,结果应用于解释宋代 钧瓷釉和天日瓷釉的艺术外观,获得了满意的答案。陈显求等从陶瓷物理化学 和陶瓷相图角度,给出了瓷釉生成分相的理论解释【2 5 】,可谓古陶瓷显微结构研 究方面较为显著的成就。遗憾地是之后确没有后续的更加深入的研究成果发表。 陶瓷的显微结构是多相非平衡的复杂结构,随着技术的发展,加速器射线 或者同步辐射光源可以提供比电子显微镜、x 射线更高能量的射线,可以观察 到更小尺度的瓷釉结构。而对于瓷釉生成分相的理论解释却有很多技术困难。 首先至今还没有一张比较完整的多元陶瓷相图,相图对于古陶瓷研究是至 关重要的,不论是对古陶瓷研究,还是对现代陶瓷生产都是不可或缺的基础。 可是,国内几乎没有人深入研究多元陶瓷相图,或是做测定多元陶瓷相图的工 作,离开了相图学的支撑,古陶瓷中生成的析晶和分相的理论研究多属于猜测, 无法进行理论推演。 另一方面,古陶瓷釉的生成过程是一个多氧化物参与的、远离平衡的物理 化学过程,属于典型的混沌热力学问题。瓷釉是多种矿物的混合物,瓷釉化学 成分分布存在局部不均匀性,古陶瓷上不同部位的瓷釉参与高温物理化学反应 的化学成分是不同的;瓷釉烧成过程中,不同的窑炉、不同的烧成曲线、不同 的气候环境,甚至不同的燃料、不同的窑炉工人等各种因素都会造成瓷釉受热 过程的差异,进而影响瓷釉的高温物理化学反应过程:瓷釉的高温黏度比较大, 即使流动性较大的瓷釉在发生高温物理化学反应时,也无法保证反应物的供给; 瓷釉从高温冷却时,通常是自然冷却,窑炉的保温性能和烧成时的气候环境影 响瓷釉的冷却温度曲线,对于瓷釉的析晶和分相有决定性的作用。 对于如次多因素的、复杂的混沌学问题,古代陶工只能凭经验、靠运气生 产出各种外观艺术效果的瓷器,而令人除了依靠“概率”之外,也没有更多的 技术手段来控制瓷釉生成过程,这可能就是古代陶工生产出许多美伦美幻的瓷 釉,今人至今无法效仿的原因。当然,今人并非无所作为,可以研究如何利用 各种现代化的技术,控制影响古陶瓷釉的主要因素,这方面的研究成果也是现 p 海大学顿十学位论文 代陶瓷生产所急需的。 古陶瓷化学成分是古陶瓷科学研究中出现频率最高的词汇。化学组成固然 是古陶瓷研究最重要的问题,通常的古陶瓷研究论文,在测定古陶瓷的化学组 成并罗列数据后,多是做一些统计和比较分析,至于化学成分是如何发生高温 物理化学反应,影响古陶瓷的显微结构、影响古陶瓷的工艺性能、影响古陶瓷 的外观特征等理论问题几乎无人问津。 古陶瓷成分研究中一个被严重忽视的问题是古陶瓷的矿相组成,包括古陶 瓷生产的矿物组成和古陶瓷成品的矿相组成。古陶瓷原料的矿物组成涉及到古 陶瓷原料的来源和加工方式、涉及到古陶瓷的配方,对古陶瓷的断源、断代研 究至关重要;古陶瓷成品的矿相也是决定古陶瓷显微结构和外观光学性质的重 要因素,这些在古陶瓷科学研究中很难找到分析数据。据了解,在民间古陶瓷 仿制作坊里,古陶瓷原料的矿物组成受到相当的重视,其研究水平远非学院派 研究者可比。 1 2 2 古陶瓷研究的现状 目前被应用于古陶瓷鉴定的科学技术手段只有热释光技术( 香港中文大学 和英国牛津大学的热释光技术鉴定成果得到国际公认) 。国内古陶瓷科学研究成 果丰硕,但是一直没有很成熟、完备的古陶瓷鉴定科学技术手段。 国内一些机构正在研究通过古陶瓷釉面化学成分无损测定结果来鉴定古陶 瓷的真伪,其中存在两个关键性的技术问题:1 ) 缺少参照系:数量足够多的古 陶瓷样品的化学组成作为参照系是鉴定古陶瓷不可或缺的基础;2 ) 缺少实用判 据:真、伪古陶瓷样品代表性不足,受获得鉴定判据的算法限制,难于得到灵 活、方便、准确率高的鉴定判据。 古陶瓷数据处理的目的是为了从已知数据中总结经验规律,进而对未知样 本进行预报或判别( 如古陶瓷的断源断代) 。这些研究从数学角度来看,都属于 聚类分析和判别分析问题。从1 9 8 0 年代以来,多元统计分析方法应用于古陶瓷 r 海大学硕士学位论文 科学数据分析,其中存在一个共同的问题,即如何得到比较准确的判据? 例如, 常用的主成分分析对样本可以进行很好的分类,得到分类图,进一步从分类图 中做出样本分割线,进而求得分类的判据。因为在两类样本的分割区间理论上 可以做出无限多的分割线,实际研究中做出的分割线往往缺少理论依据,随意 性很大,当样本数量有限时,得到的判据可靠性较低。 近年来模式识别和人工神经网络等机器学习方法也越来越多地在古陶瓷数 据分析中得到应用。多元统计分析诸方法主要解决线性或接近线性的数据分析 问题,当数据规律偏离线性时,通常采用人工神经网络或在线性方程中添加高 次项的算法来处理数据。 在古陶瓷研究中,人们经常会发现用上述各种方法总结的数学模型对已知 数据( 即所谓训练集) 常熊较好地拟合或分类,面预报未知样本时,偏差往往 较大,当训练样本较少,而特征变量( 如化学成分) 数较多时,这种现象尤其 严重。于是,很多古陶瓷研究论文中就有意无意地忽略对数学模型( 或分类判 据) 进行验证。 在数学上看,上述问题称为数学模型“推广能力”( g e n e r a l i z a t i o na b i l i t y ) ;下 足的问题。如何提高算法和数学模型的推广能力,以确保预报结果的可靠性和 准确性,关系到基于古陶瓷数据的数据模型的实用性问题,至今为止的古陶瓷 科学研究成果难于应用到古陶瓷鉴定实践中,这是很重要的原因之一。 1 3 参考文献 1 b r o o k e saj g e n e ,1 9 9 9 ,2 3 4 :1 7 7 【2 j m a r t i n er ,l a ie h ,g i l b e r tj r ,r o g a l a a r ,a f s h a r i aj ,r i l e yj ,f i n c h k l s t e v e n sjf l i v a kk j ,s l o t t e r b e e kbd a m 1h u mg e n e t ,2 0 0 0 ,6 7 :3 8 3 3 】3 h o r i k a w ay ,o d an ,c o xnj ,l ix ,o r h o m e l a n d e rm ,h a v a m ,h i n o k i oy , l i n d n e rth ,m a s h i l t l ah ,h i n o k i oy n a t g e n e t ,2 0 0 0 ,2 6 :16 3 4 】m u l l i k i njc ,h u n tse ,c o l ecg ,m o r t i m o r ebj ,r i c ec m ,b u r t o nj ,m a t t h e w s 圭塑叁兰堡主竺焦堡塞 lh ,p a v i t t 心p l u m br w ,s i m ssk ,e ta 1 n a t u r e ( l o n d o n ) ,2 0 0 0 ,4 0 7 :5 1 6 5 j o h n s o ngc ,t o d dja c u r ro p i ng e n e td e v ,2 0 0 0 ,10 :3 3 0 6 】n e im m o l e c u l a re v o l u t i o n a r yg e n e t i c s n e wy o r k :c o l u m b i a u n i v e r s i t yp r e s s , 1 9 8 7 2 8 7 】y a s u y u k it o m i t a ,s h u t at o m i d a ,y u k oh a s e g a w a ,y o i c h is u z u k i ,t a r o s h i r a k a w a ,t a k e s h ik o b a y a s h ia n dh i r o y u k ih o n d a a r t i f i c i a ln e u r a ln e t w o r k a p p r o a c hf o r s e l e c t i o no fs u s c e p t i b l e s i g l en u c l e o t i d ep o l y m o r p h i s m sa n d c o n s t r u c t i o no f p r e d i c t i o n m o d e l 。nc h i l d h o o d a l l e r g i c a s t h m a b m c b i o i n f o r m a t i c s , 2 0 0 4 ,5 :1 2 0 8 】h a l u s h k amk ,f a njb ,b e n t l e yk ,h s i el s h e nn ,w e d e r a ,c o o p e rr , l i p s h u t zr ,c h n k r a v a r t ia n a tg c n e t ,19 9 9 ,2 2 :2 3 9 9 】c h a s m a nd ,a d a m sr m jm o lb i o l ,2 0 0 1 ,3 0 7 :6 8 3 【10 s u n y a e vs ,r a m e n s k yv ,k o c hi ,l a t h ewi i i ,k o n d r a s h o va s ,b o r kp h u m m o lg e n e t ,2 0 0 1 ,1 0 :5 9 1 【1l l n gpc ,h e n i k o f f s g e n o m er e s e a r c h ,2 0 0 1 ,11 :8 6 3 【1 2 t h ei n t e r n a t i o n a ls n pm a pw o r k i n gg r o u p ( i s m w g ) am a po f h u m a ng e n o m e s e q u e n c ev a r i a t i o nc o n t a i n i n g 1 4 2m i l l i o ns i n g l en u c l e o t i d ep o l y m o r p h i s m s n a t u r e ,2 0 0 1 ,4 0 9 :9 2 8 - 9 3 3 1 3 l a n d e re sa n ds c h o r kn j g e n e t i cd i s s e c t i o no fc o m p l e xt r m t s s c i e n c e ,1 9 9 4 , 2 6 5 :2 0 3 7 2 0 4 8 1 4 t i s c h k o f fs a e ta l 。g l o b a lp a r e m so fl i n k a g ed i s e q u i l i b r i u ma tt h ec d 4l o c u s a n dm o d e mh u m a no r i g i n s s c i e n c e ,1 9 9 6 ,2 7 1 :1 3 8 0 1 3 8 7 【1 5 p e l t o n e nl ,p a l o t i ea ,l a n g ek u s eo f p o p u l a t i o ni s o l a t e sf o rm a p p i n gc o m p l e x t r a i t s n a t u r er e v i e w sg e n e t i c s , 2 0 0 0 ,1 :1 8 2 1 9 0 1 6 c h a k r a v a r t h ya s i n g l en u c l e o t i d ep o l y m o r p h i s m s t oa f u t u r eo fg e n e t i c m e d i c i n e n a t u r e ,2 0 0 1 ,4 0 9 :8 2 2 8 2 3 1 7 p e l t o n e nla n dm c k u s i c kv a d i s s e c t i n gh u m a n d i s e a s ei nt h ep o s t g e n o m i ce r a s c i e n c e ,2 0 0 1 ,2 9 1 :1 2 2 4 1 2 2 9 ,8 上海大学硕上学位论文 1 8 w a n gdg ,f a njb ,s i a ocj ,b e m oa ,y o u n gp ,s a p o l s k yr ,g h a n d o u rg , p e r k i n sn ,w i n c h e s t e re ,s p e n c e rj ,e ta 1 s c i e n c e ,l9 9 8 ,2 8 0 :10 7 7 1 9 s h e r r yst ,w a r dmh ,k h o l o d o vm ,b a k e rj ,p h a nl ,s m i g i e l s k iem ,s i r o t k i n k n u c l e i ca c i d sr e s ,2 0 01 ,2 9 :3 0 8 2 0 f r e d m a nd ,s i e g f r i e dm ,y u a nyp ,b o r kp ,l e h v a e s l a i h oh ,b r o o k e sa j n u c l e i ca c i d sr e s ,2 0 0 2 ,3 0 :3 8 7 2 1 】苏智广等中华医学遗传学杂志( c h i njm e dg e n e t ) ,2 0 0 0 ,1 7 ( 3 ) :1 5 7 1 6 0 2 2 1 吴弘等,中华医学遗传学杂志( c h i n jm e dg e n e t ) ,2 0 0 1 ,1 8 ( 1 ) :1 3 【2 3 】施锦绣等中华医学遗传学杂志( c h i njm e dg e n e t ) ,2 0 0 1 ,1 8 ( 3 ) :1 9 8 2 0 1 2 4 】轻工业部陶瓷研究所:铁红釉制备工艺的研究,瓷器,1 9 8 0 ,w 0 1 4 ,p 5 1 1 【2 5 李家治,陈显求等中国古代陶瓷科学技术成就,上海科学技术出版社,1 9 8 5 , p 1 9 5 2 1 0 上海大学硕十学位论文 2 1 模式识别 第二章算法介绍 2 1 1 模式识别方法的原理和基本概念 模式识别是数据采掘技术的主要方法之一,大致可分为统计模式识别 ( s t a t i s t i c a lp a t t e r nr e c o g n i t i o n ) 年n 句法模式识另l j ( s y n t a c t i cp a t t e r nr e c o g n i t i o n ) 两大 类。统计模式识别将每个样本用特征参数( 在优化中,经常将描述工况的参数如 组成、温度、压力等条件的数值作为“特征参数”) 表示为多维空间中的个点, 根据叫勿以类聚”的原理,同类或相似的“样本”间的距离较近,不同类的“样 本”间的距离较远。这样,就可以根据各样本间的距离或距离的函数来判别、 分类,并利用分类结果预报未知。这种统计模式识别是材料设计、工业优化和 工业诊断的一种基本方法。 句法模式识别是以模式结构信息为对象的识别技术。在遥感图片处理、指 纹分析、汉字识别等方面已有广泛应用。由于句法模式识别更便于处理图像和 结构信息,今后可能在有机分子设计和工业优化工作的图像处理中有用。 统计模式识别的首要目标是样本及其代表点在多维空间中的分类。科学技 术中的分类方是有两种:种是事先规定分类的标准和种类的数目,通过大批 已知样本的信息处理( 称为“训练”或“学习”) 找出规律,再用计算机预报未 知,这称为“有人管理分类”( s u p e r v i s e dc l a s s i f i c a t i o n ) ;另一种是只有一大批样 本,事先没有规定要分成几类,却要求通过信息处理找出合适的分类方法并实 现样本分类,这称为“无人管理分类”( u n s u p e r v i s e dc l a s s i f i c a t i o n ) 。在分子设计 和材料设计、工业优化、工业诊断等应用中,主要用有人管理分类方法。 模式识别最简单的分类问题是将样本分为互不相容的两类( 即第一类样本 包括所有符合某种标准的样本,第二类样本包括不符合某种标准的样本) 。若在 多维空间中能找到一个超平面或超曲面能将两类样本的代表点分在两个区,则 上海人学硕上学位论文 求该超平面或超曲面的计算称为“训练”( t r a i n i n g ) 或“学习”( 1 e a r n i n g ) 。所根 据的样本或样本点称为“训练点”( t r a i n i n g p o i n t s ) 或“训练集”( t r a i n i n gs e t ) 。模 式识别计算也可一次将样本分为多类。在材料设计、工业优化、工业诊断工作 中,当样本需作多类分类时,较常用的办法是先将样本分为两类,然后再将分 类后的每一类用模式识别分两类,这种多次分类的方法,分类效果往往较一次 分多类为好。 通过已知样本的有人管理分类,可以求出某一类样本的判据( 数学模型) 。 为了考查这样建立的数学模型的有效性和可靠性,有两类方法。最有说服力的 方法当然是用已建立的数学模型预报未知,然后用实验
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 艺术培训上门服务创新创业项目商业计划书
- 2025年教师招聘之《小学教师招聘》通关练习题和答案【有一套】附答案详解
- 2025内蒙古呼伦贝尔林业集团有限公司招聘工作人员5人备考及答案详解(夺冠)
- 2025年教师招聘之《小学教师招聘》通关题库(完整版)附答案详解
- 2025年江西景德镇学院选聘思政课专任教师考试笔试试题(含答案)
- 2025广东广州银行人才招聘笔试备考试题及答案解析
- 2025年度上海市考试录用执法类公务员1004人笔试备考试题及答案解析
- 合肥市商品住宅房地产市场发展趋势:洞察与展望
- 航空航天科技公司股权置换与航天器研发合作协议
- 门诊共济面试题库及答案
- 2024心肺复苏培训课件完整版
- 失能老人健康知识讲座
- 小针刀治疗的应急预案
- 业务外包作业人员培训管理办法
- 中央企业合规管理办法
- 物理化学实验B智慧树知到课后章节答案2023年下北京科技大学
- 1-丁烯安全技术说明书MSDS
- 技术类《核电站通用机械设备》第1部分(阀门)
- 现场签证单模板
- 风机盘管更换施工方案
- Analyst软件应用培训教程
评论
0/150
提交评论