(微生物与生化药学专业论文)重楼属dna条形码筛选与鉴定方法研究.pdf_第1页
(微生物与生化药学专业论文)重楼属dna条形码筛选与鉴定方法研究.pdf_第2页
(微生物与生化药学专业论文)重楼属dna条形码筛选与鉴定方法研究.pdf_第3页
(微生物与生化药学专业论文)重楼属dna条形码筛选与鉴定方法研究.pdf_第4页
(微生物与生化药学专业论文)重楼属dna条形码筛选与鉴定方法研究.pdf_第5页
已阅读5页,还剩59页未读 继续免费阅读

(微生物与生化药学专业论文)重楼属dna条形码筛选与鉴定方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西南交通大学硕士研究生学位论文第1 页 摘要 d n a 条形码是一种利用短的、标准的d n a 片段鉴定物种的新兴技术。本论文旨 在评价d n a 条形码候选序列对重楼属的鉴定作用,探讨重楼属植物鉴定新方法,另外, 以百合纲i t s 2 序列作为研究对象,对d n a 条形码鉴定算法进行比较,并考察其鉴定 效率。本研究对重楼属1 1 个物种1 7 份样品的筇m t r n h 、r p o b 、r p o c l 、r b c l 、m a t k 和 i t s 2 序列进行p c r 扩增和测序,比较各序列扩增和测序效率、种内和种间变异,进行 b a r c o d i n gg a p 分析,采用b l a s t l 和n e a r e s td i s t a n c e 方法评价不同序列的鉴定能力。 以百合纲i t s 2 序列作为研究对象,在广泛的分类类群中考查i t s 2 序列的鉴定能力, 讨论相似性搜索算法、基于序列比对的距离算法、基于隐马尔科夫模型的h m m 算法 以及诊断算法在d n a 条形码鉴定中的能力。 本文的主要研究结果如下: l 、i t s 2 序列在所研究的重楼属植物中的扩增和测序成功率均为1 0 0 ,其种内种 间变异、b a r c o d i n gg a p 与其他d n a 条形码候选序列相比具有明显的优势,i t s 2 序列 在重楼属中的鉴定成功率达到1 0 0 ,而生命条形码联盟( c b o l ) 推荐的m a t k 和r b c l 序列的鉴定成功率分别为5 2 9 和5 9 ,二者联合鉴定能力没有提高。对于i t s 2 序列 扩大至2 9 个物种( 含1 0 个变种) 6 7 份样品依然具有1 0 0 的鉴定成功率。实验结果 表明,i t s 2 序列可以准确鉴定重楼属植物,能够正确区分重楼及其混伪品。 2 、以百合纲i t s 2 序列作为研究对象,比较b l a s t 、h m m 、k 2 pd i s t a n c e 和 d n a b a r 方法,同时考查了百合纲i t s 2 序列的鉴定能力,得出b l a s t 和h m m 方 法在d n a 条形码鉴定中具有显著优势,不仅准确性和精确度较高,并且耗时短,适合 于大规模批量化鉴定。i t s 2 序列在百合纲中的鉴定能力显著,证明了i t s 2 序列在广泛 的分类类群中同样具有高的鉴定能力。 3 、对百合纲i t s 2 序列进行特征分析,结果显示百合纲i t s 2 序列长度稳定,主要 集中在2 1 4 2 6 0 b p ,g c 含量在4 7 7 3 范围内,证明其分子结构稳定。讨论重楼属i t s 2 序列在百合纲中的鉴定情况,使用b l a s t 和h m m 方法都能够正确识别重楼属的6 7 份样本。最后,本研究建立了百合纲i t s 2 序列数据库,供进一步的科学研究。 关键词:重楼属;百合纲;d n a 条形码;i t s 2 ;鉴定算法;数据库 西南交通大学硕士研究生学位论文第1i 页 a b s t r a c t d n ab a r c o d i n gw a sat e c h n i q u ei nw h i c hs p e c i e si d e n t i f i c a t i o na n dd i s c o v e r yw e r e p e r f o r m e db yu s i n gs h o r ta n ds t a n d a r df r a g m e n to fd n as e q u e n c e s s t u d yo nd n a b a r c o d e s i nt h eg e n u sp a r i s ,c l a s s i f i c a t i o na n di d e n t i f i c a t i o nc o u l db ec l a r i f i e df u r t h e r i nt h i ss t u d y , e l e v e ns p e c i e so fp a r i s ,i n c l u d i n gs e v e nv a r i e t i e s ,w e r es a m p l e d f i v ec h l o r o p l a s ts e q u e n c e s , p s b a r r n h , r p o b ,r p o c l ,r b c l ,m a t k , a n d o n en u c l e a rm a r k e r , t h es e c o n di n t e r n a l t r a n s c r i b e ds p a c e r ( i t s 2 ) o fr i b o s o m a ld n a ,w e r ea m p l i f i e da n ds e q u e n c e d t h ep c r a m p l i f i c a t i o na n ds e q u e n c i n ge f f i c i e n c y , i n t r a - a n di n t e r s p e c i f i cd i v e r g e n c ea n db a r c o d i n g g a pw e r eu s e dt oe v a l u a t ed i f f e r e n tl o c i ,a n dt h ei d e n t i f i c a t i o ne f f i c i e n c yw a sa s s e s s e du s i n g b l a s t1a n dn e a r e s td i s t a n c em e t h o d s g o o da l g o r i t h m ss h o u l db ea p p l i c a t e di nd n a b a r c o d i n g a l sg o o ds e q u e n c e sw e r es e l e c t e d u s i n gl i l i o p s i d ar e f e r e n c ed a t a b a s e t h e i d e n t i f i c a t i o ne f f i c i e n c yo fs i m i l a r i t ym e t h o d s ,d i s t a n c em e t h o d s ,h m mm e t h o d sa n d d i a g n o s t i cm e t h o d sw e r es t u d i e d 1 。t h ei t s 2s e q u e n c e si nt h es t u d i e ds a m p l e so fp a r i sw e r ea m p l i f i e da n ds e q u e n c e d s u c c e s s f u l l yu s i n gp r i m e r sd e s i g n e db yo u rg r o u p ,w h i l em a t ks h o w e dl o wl e v e li nt h e a m p l i f i c a t i o na n dp s b a t r n hw a s d i f f i c u l tf o rs e q u e n c i n gb e c a u s eo fo v e r8 0 0 b pa n dp o l y ( a ) s t r u c t u r e a n a l y s i so ft h ei n t r a - a n di n t e r s p e c i f i cd i v e r g e n c ea n db a r c o d i n gg a p s h o w e di t s 2w a ss u p e r i o rt oo t h e rl o c i t h ei t s 2s h o w e dam u c hh i g h e rp e r c e n t a g eo f s u c c e s s ( 10 0 ) i ni d e n t i f i c a t i o nt h a no t h e rf i v el o c i ,n o n eo fw h i c hi n d i c a t e dm o r et h a n 5 0 e x c e p tm a t k ( 5 2 9 ) t h e2 - l o c u sc o m b i n a t i o no fr b c l + m a t k d i d n ti m p r o v ea b i l i t y o fa u t h e n t i c a t i o n i na d d i t i o n t h er a t eo fs u c c e s s f u li d e n t i f i c a t i o nw i t hi t s 2k e p t10 0 w h e nt h es a m p l e sw e r ee x p a n d e dt o6 7s a m p l e so f2 9s p e c i e s i nc o n c l u s i o n , i t s 2c o u l db e u s e dt oi d e n t i f yp l a n to fp a r i sc o r r e c t l y , a n di tw o u l db eap o t e n t i a ld n ab a r c o d ef o r i d e n t i f y i n gp l a n to fo t h e rt a x a 2 i no u rs t u d y , b l a s t ,h m m ,k 2 pd i s t a n c ea n dd n a b a rw e r eu s e dt od i s t i n g u i s ht h e s p e c i e so fl i l i o p s i d a a c c o r d i n gt ot h er e s u l t s ,b l a s ta n dh m m m e t h o d sw e r es u p e r i o rt o o t h e r sb e c a u s eo fh i g hp r e c i s i o na n da c c u r a c y ,a n da p p r o x i m a t e l y8 0 s a m p l e sc o u l db e d i f f e r e n t i a t e dp e r f e c t l y b a s e do nb l a s ta n dh m mm e t h o d s ,r a p i da n da u t o m a t a b l e i d e n t i f i c a t i o nf o rq u e r yw a sp o s s i b l y t h ei d e n t i f i c a t i o ne f f i c i e n c yw a sa p p a r e n ti nl i l i o p s i d a f o ri t s 2 ,i tw o u l db ea p o t e n t i a lb a r c o d ei np l a n t 3 f e a t u r ea n a l y s i so fl t s 2s e q u e n c e sw a sn e c e s s a r yb e c a u s eo fs u c c e s s f u lr e s u l t si np a r i s , e v e nl i l i o p s i d a a st h er e s u l t s ,t h es e q u e n c e sl e n g t hw a sl o wv a r i a t i o n ,r a n g e df r o m214 b p 西南交通大学硕士研究生学位论文第f il 页 t o2 6 0 b p ,a n dg cc o n t e n t sw e r ef r o m4 7 t o7 3 m a i n l y u s i n gb l a s ta n dh m m m e t h o d s ,6 7s a m p l e so fp a r i sc o u l db ed i s t i n g u i s h e ds u c c e s s f u l l yf o ri t s 2i nl i l i o p s i d a l a s t l y , l i l i o p s i d ai t s 2d a t a b a s ew a se s t a b l i s h e df o rf u r t h e rs t u d y k e y w o r d s :p a r i s ;l i l i o p s i d a ;d n ab a r c o d e s ;i t s 2 ;i d e n t i f i c a t i o na l g o r i t h m s ;d a t a b a s e 西南交通大学曲南父逋大字 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并 向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授 权西南交通大学可以将本论文的全部或部分内容编入有关数据库进行检索,可以采用 影印、缩印或扫描等复印手段保存和汇编本学位论文。 本学位论文属于 1 保密口,在年解密后适用本授权书; 2 不保密彩使用本授权书。 ( 请在以上方框内打“4 ) 学位论文作者签名:束芟杰指导新签名:帮 日期:汐。,呼石问,因日期:如。牟多橱歹目 西南交通大学硕士学位论文主要工作( 贡献) 声明 本人在学位论文中所做的主要工作或贡献如下t ( 1 ) 对重楼属6 条d n a 条形码候选序列( p s b a t r n h 、r p o b 、r p o c l 、r b c l 、m a t k 和i t s 2 ) 进行扩增及测序,根据序列种内种间变异程度和鉴定能力等,筛选最适合作 为d n a 条形码的序列,得出i t s 2 序列对重楼属的鉴定能力是最强的。 ( 2 ) 以百合纲i t s 2 序列作为样本序列,讨论相似性搜索算法、基于序列比对的 距离算法、基于隐马尔科夫模型的h m m 算法以及诊断算法在d n a 条形码鉴定中的精 确度和准确性,通过比较选取d n a 条形码鉴定的最优算法,得出b l a s t 和h m m 算 法最适合用于条形码鉴定。同时考查百合纲i t s 2 序列的鉴定能力,得到了较好的鉴定 结果。 ( 3 ) 使用生物信息学软件对百合纲i t s 2 序列进行特征分析,使用m y s q l 语言建 立百合纲i t s 2 序列关系数据库,为条形码鉴定及研究提供参考。 本人郑重声明:所呈交的学位论文,是在导师指导下独立进行研究工作所得的成 果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰 写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中作了明确说明。 本人完全了解违反上述声明所引起的一切法律责任将由本人承担。 学位论文作者签名:三l 真之卜 日期: 一纠p 哥好,目 西南交通大学硕士研究生学位论文第1 页 第1 章项目背景及主要内容 1 1 本课题的研究背景及意义 1 1 1d n a 条形码研究背景 d n ab a r c o d i n g ( d n a 条形码) 的概念由d n a 条形码之父、劲口拿大动物学家p a u l h e b e r t 于2 0 0 3 年首次提出【,至此,d n a 条形码研究已成为近年来生物和分类学研究的 热点和前沿【2 】。d n a 条形码技术是利用基因组中一段通用的标准短序列来进行物种鉴 定的分子诊断新技术【3 】,通过建立生物d n a 条形码系统能够实现快速、准确和自动化 的物种鉴定【4 】。它可以用于辅助形态学鉴定,也能够独立鉴定未知物种。此外,d n a 条形码还可用于生物多样性保护,分子进化研究,甚至法医鉴定等。 1 1 2 重楼属研究背景 重楼属p a r i sl 是百合科多年生草本植物,中国植物志英文版【5 l 中记载重楼属植 物全世界约有2 4 种,1 0 个变种和若干变型,主要分布在欧亚大陆的热带至温带地区; 我国有1 9 种,1 0 个变种,大部分省区均有分布,主产云南、贵州、四川、广西等地, 在云南分布最为集中,有1 4 种,其中3 种为云南特有【6 】。重楼属植物在国内多做药用, 具有抗癌、清热解毒、消肿止痛和止血作用,其中滇重楼( p a r i sp o l y p h y l l av a r y u n n a n e n s 括( f r a n c h ) h a n d - m a z z ) 及华重楼( 尸p o l y p h y l l av a r c h i n e n s i s ( f r a n c h ) h a r a ) 收载于2 0 0 5 年版中国药典,是云南白药等多种中药的重要原料之一。 重楼属分类系统复杂,由于不同类群的特征性状交叉重叠,各类型界限模糊不清, 给重楼属植物鉴定带来困难川。重楼属的分类长期存在争议,h a r a 8 1 ,l i 【6 9 1 和m i t c h e l l l l o 】 基于花萼的数目将其划分为广义的重楼属,重楼属有4 1 5 个萼片,而它的姐妹属延龄 草属只有3 个萼片。根据果实类型,子房形状,种子形态和根茎形状,t a k h t a j a n 1 q 将 重楼属划分为:p a r i s ( 狭义) ,k i n u g a s a 和d a i s w a 三个属。根据l i t 6 】的研究,狭义的 重楼属可以分为k i n u g a s a ,肋括,a x i p a r i s 三个类群。最近的系统发育研究显示,基 于m a t k 、r b c l 和核糖体核i t s 序列都支持了重楼属的单系性,j i 等【_ 7 】对重楼属的2 1 个物种和4 个变种的i t s ,t r n l 护栌和筇明f 聊日三个序列进行研究,数据支持了重楼 属区别于其它两个属的单属地位,该研究在分子水平上为重楼属的系统分类奠定了基 西南交通大学硕士研究生学位论文第2 页 i ii i 曼曼曼曼曼皇曼曼曼! 曼曼曼曼曼曼曼曼! ! 曼笪! 曼曼! 曼曼曼曼! 曼曼曼曼! 曼舅曼笪 础。 目前,重楼需求量增大,野生重楼资源急剧减少,商品药材品种混乱,药材品质 不一1 5 j ,寻找鉴定重楼药材的有效方法对于药材品种鉴定、资源保护具有重要意义。 根据重楼属d n a 条形码能够从分子水平上对重楼属物种分类和鉴定展开研究,本 论文也希望通过对重楼属密切相关种的研究解决重楼药用植物鉴定问题,进而对陆地 植物d n a 条形码序列进行探讨。 1 。2 国内外研究现状 截止目前,生命条形码联盟( c o n s o r t i u mf o rb a r c o d eo f l i f e ,c b o l ) 在动物界已 经确定线粒体细胞色素c 氧化酶亚基i ( c y t o c h r o m eco x i d a s es u b u n i t1 ,c 0 1 ) 的一段序 列作为动物条形码( h t t p :l l w w w b o l d s y s t e m s o r g v i e w s l o g i n p h p ) 。在植物界,研究者 们已经提出了1 0 多条候选d n a 条形码序列【1 2 】,并在不同的植物类群中对各条形码的鉴 定能力进行了考察,c b o l 对陆地植物的5 5 0 个物种进行研究,得出r b c l 和m a 在物种 水平的联合鉴定成功率达到7 2 ,属水平的鉴定成功率达1 0 0 ,因此,c b o l 提出使 用r b c l + m a t k 复合序列作为植物界的通用条形码序列【1 3 】。然而,由于m a t k 的扩增效率 不高,单序列的鉴定成功率很低等问题,其在植物界的通用性仍然受到限制,需要做 出进一步的研究。 有关重楼植物鉴定,已有形态学、细胞学( 包括核型和染色体多态性) 方面的研究, 亦有r a p d ,a f l p 等d n a 分子标记方面【1 41 5 1 的研究,这些研究都为重楼属植物的鉴 定提供了依据。如今,d n a 条形码技术的出现为植物鉴定带来了新的机遇【4 】,它不再 局限于植物形态和性状,而是从遗传学角度获取样本的遗传信息,能够快速、准确的 鉴定物种。 目前,国内外尚未有重楼属d n a 条形码研究的报道,本文以重楼属为研究对象, 对d n a 条形码展开研究。 1 3 本课题研究的主要内容和方法 1 3 1 主要内容 本课题的主要内容包括以下几个方面: ( 1 ) 重楼属d n a 条形码序列比较与筛选: 西南交通大学硕士研究生学位论文第3 页 ( 2 ) d n a 条形码鉴定算法研究与百合纲i t s 2 序列鉴定效率考查; ( 3 ) 基于百合纲i t s 2 序列的特征分析和d n a 条形码数据库。 1 3 2 主要方法 ( 1 ) 采用p c r 技术扩增特定引物片段,测序获得d n a 碱基序列: ( 2 ) 使用p e r l 语言建立d n a 条形码鉴定流程,实施条形码鉴定; ( 3 ) 基于l i n u x 操作系统使用m y s q l 查询语言建立d n a 条形码数据库。 1 4 本研究课题的来源 本课题为国际科技合作项目“中药材d n a 条形码鉴定研究 ( 2 0 0 7 d f a 3 0 9 9 0 ,该 项目由科技部组织,中国医学科学院药用植物研究所承担) 和卫生行业科研专项项目 “药用植物d n a b a r c o d i n g ( 条形码) 鉴定研究”( 2 0 0 8 0 2 0 4 3 ,组织形式同上) 的研究 内容。 西南交通大学硕士研究生学位论文第4 页 第2 章d n a 条形码与生物信息学研究概述 2 1d n a 条形码研究概述 d n a 条形码是利用标准的、有足够变异的、易扩增且相对较短的d n a 片段( d n a b a r c o d e ) 而建立的一套新的生物身份识别系统,该片段具有物种种内特异性和种间多 样性,可以对物种进行快速、精确、自动的鉴定【1 j 。早在p a u lh e b e r t 提出d n a 条形码概 念之前,人们已经开始利用d n a 片段研究细菌和古细菌的分类与系统发育。直至1 2 0 0 3 年p a u lh e b e r t 才真正提出了“d n ab a r c o d i n g ( 条形码) 的概念,h e b e r t 等在动物中 选取线粒体基因片段细胞色素c 氧化酶亚基i ( c y t o c h r o m eco x i d a s es u b u n i tl ,c o i ) 的 一段序列在不同分类水平上( f - j 、目、种) 进行分析,发现无论在哪个分类水平上该 基因都具有良好的识别能力,从而提出建立以一段6 5 0 b p 长的c o i 基因序列为基础的条 形码识别方法。基于c o i 序列,一些类群中己部分实现了条形码鉴定,如蝴蝶i l 6 1 8 1 、鸟 类1 9 2 2 1 和鱼类口32 4 1 。c o i 在真菌和藻类中的分辨率较高,亦可使用,但对于陆地植物因 其线粒体基因的进化速率相对较慢而不适合。因此,在对植物的研究中,不少学者尝 试从叶绿体基因组和核基因组中寻找理想的d n a 条形码【2 5 2 引。 2 1 1d n a 条形码的标准和优点 理想的d n a 条形码应符合以下标准【1 2 1 32 7 2 8 】: ( 1 ) 具有可以区分物种的足够遗传变异和分化,同时种内变异足够小; ( 2 ) 片段足够短,便于d n a 提取、扩增和测序,尤其对于发生降解的样品,短片 段降解的几率小; ( 3 ) 有高度保守的引物设计区,便于设计通用引物。 c b o l 概括y d n a 条形码的优点【1 2 】( h t t p :p h e r o c ke f e l l e r e d u b a r c o d e ) : ( 1 ) 不受个体形态特征限制。当样本只有一部分组织也可以识别这个物种,弥补 了传统鉴定方法依赖于整体形态的局限。 ( 2 ) 不受个体发育阶段影响。条形码不受生物的遗传表现型影响,对于某些物种 即使不同的发育阶段在形态上有明显的差异,也能够使用条形码鉴别。 ( 3 ) 对于分类学中难以区分的类群,使用d n a 条形码可以抛开形态相似的假象, 从分子水平上提供一种分类依据。 ( 4 ) 由a 、t 、g 、c 核苷酸序列组成的数据库可以被视为数字化的数据库,提供 西南交通大学硕士研究生学位论文第5 页 明确的信息,不仅弥补了形态描述的不足,而且可以加快已知物种的识别速度,同时 便于新物种的发现,这将会使分类学科的发展更加快速和深入。 ( 5 ) 如果条形码扫描仪可以实现,使用很小的手持设备就可以完成样品的处理、 扩增和测序,将会减少对传统分类学人力和物力的需求。 2 1 2 植物d n a 条形码研究现状 在植物中d n a 条形码的研究进展相对缓慢,主要有两方面原因: ( 1 ) 植物线粒体基因组进化速率较慢,遗传分化小,因此动物中的标准片段c o l 不适用于植物; ( 2 ) 系统学研究中常用的片段变异较小,不适合用作条形码片段【2 5 。2 7 】。叶绿体为 单亲遗传,可避免遗传重组,同时包含许多变异区域,核糖体内转录间隔区( i n t e r n a l t r a n s c r i b e ds p a c e r s ) 是最常用的植物分子系统研究序列【2 9 】,植物叶绿体和核糖体的进 化速率快于线粒体3 0 1 ,因此,植物学家推荐的潜在条形码区域主要集中在核糖体间隔 区和叶绿体基因组的编码和非编码区域2 7 之83 0 1 。c b o l 植物工作组最初建议的植物条形 码片段均为叶绿体片段:m a r k ( m a t u r z l s ek ) ,r p o c l ( r i b o n u c l e i ca c i dp o l y m e r a s ec 1 ) , r p o b ( r i b o n u c l e i c a c i dp o l y m e r a s eb ) ,a c c d ( a c e t y l c o ac a r b o x y l a s eb e t as u b u n i t ) ,n h d j ( n i c o t i n - a m i d ea d e n i n ed i n u c l e o t i d ed e h y d r o g e n a s es u b u n i tj ) 和y c f 5 ( h y p o t h e t i c a l c h l o r o p l a s t r e a d i n gf r a m e5 ) ,但因为后3 个片段在一些主要的植物类群中有缺失,j t n a c c d 在禾本科植物中缺失,y c f 5 在苔藓类植物中缺失,而船舳松属植物中缺失,在部分兰 花中变短或功能丧失,因此它们在第二阶段的更新中己被排除( h t t p :w w w k e w o r g b a r c o d i n g ) 。 下面对植物d n a 条形码研究中常用的热点序列进行概述: m a 是叶绿体上进化最快的一段编码序列,该片段大小合适,种间差异度高且碱 基转换颠换数低【1 2 】。l a h a y a 等t 3 1 1 基于朋口删芋列,使用3 9 0 f 1 3 2 6 r 弓i i 物对兰科超过1 0 0 0 个物种进行分析研究,得到了1 0 0 的扩增成功率,揭示了使用m a t k 区分物种具有明显 的优势。c b o l 也对此进行验证,该工作组得出m a t k 的单序列鉴定成功率为6 6 ,其在 被子植物和裸子植物中得到了较好的扩增,但在隐花植物( 以孢子繁殖的植物,包括 藻类、苔藓、地衣和蕨类植物) 中难于扩增,其测序和组装难度适中【1 3 】。但是,s a s s 等未能在苏铁目中得到理想的扩增引物,k r e s s 掣2 7 1 对4 8 个属9 6 个物种进行扩增,仅 获得3 9 3 的鉴定成功率,相l 匕r b c l 、r p o b 2 、r p o c l 是最低的,f a z e k a s 等【3 3 j 使用了1 0 西南交通大学硕士研究生学位论文第6 页 对该片段的不同引物,在3 2 属9 2 种2 5 1 个个体中进行扩增得至1 j 8 7 6 的成功率。 r b c l 序列是叶绿体上的一段编码基因,它具有易于扩增、通用性较好等特点,但 同时柏以的变异主要存在于种以上水平,物种水平上通常变异不够大【3 1 3 5 】。n e w m a s t e r 等【”】对g e n b a n k 中超过1 万条r b c l 序列进行比较分析,发现r b c l 不能很好的用于区 分物种,但在属水平具有一定的区分能力。f a z e k a s 等 3 3 j 用2 对引物对3 2 属9 2 种植物 的2 5 1 份样品材料的扩增成功率达到1 0 0 ,该片段对物种的正确识别率仅为4 8 ,其 它许多研究也发现r b c l 在种水平的差异不够大,不适于单独作条形码。 t r n h - p s b a 是叶绿体基因组中进化最快的片段之一【27 1 ,其3 端的p s b a 序列为编码 基因,序列保守,易于引物设计和扩增,该片段富含p o l y t 结构,且存在普遍的插 入缺失现象,使得不同植物长度差异较大。k r e s s 等对多个候选片段( m a t k ,r p o b ,i t s , r p o c l ,r b c l ,t r n h - p s b a ,a c c d ,n h d j 和y c f 5 ) 进行研究,得出t r n h - p s b a 序列的通用 性最好,其序列的变异程度也足够大,并推荐使用t r n h - p s b a ,而以双序列作为条形码。 但s a s s 掣3 2 】采用k r e s s 等推荐的引物在苏铁目植物中除苏铁c y c a s 外均扩增出两条带, 表明t r n h - p s b a 间隔区不适于作为苏铁目植物的条形码。在伞形科独活属和禾本科甜茅 属植物中,t r n h - p s b a 片段也被i y _ n 变异度不够不足以识别物种【3 6 聊j 。 r p o c l 也是目前的热点候选序列之一。f a z e k a s 等【3 3 j 采用3 对引物对3 2 属9 2 种植 物的2 5 1 份样品材料的测序成功率达到9 4 8 ,但是r p o c l 单片段对所测物种的正确 识别率仅为2 9 。所以r p o c l 片段种间差异度偏小是其作为条形码的最大障碍,由于 该片段易于扩增,引物通用性好,因此可考虑和其他片段组成复合序列作为条形码。 r p o c l 的复合序列方案由c h a s e 等在2 0 0 7 年【3 8 】提出,是由相对保守的编码基n ( r p o c l ) 加进化相对较快的编码基因( m a t k ) 或非编码区( t r n h - p s b a ) 组成。r p o c l 引物通用 性好,扩增成功率高,进化较慢,但也能区分相当数量的物种。 i t s 2 ( i n t e r n a lt r a n s c r i b e ds p a c e r2 ) 是真核生物r e i n a 顺反子的重要部分,位于5 8 s r r n a 基因区和大的亚单位( l a r g es u b u n i t ,l s u ) 编码区之间,通过酵母插入突变实 验研究基因的功能,得出间隔区序列在成熟核糖体的功能完整性方面具有重要的作用 3 9 - 4 2 j 。i t s 2 区域在基因组中的多拷贝现象是随机的,i t s 2 基因家族进化过程中作为单 基因协同进化的位点。i t s 2 在一级结构上的高度变异性,使它在属及物种水平成为研 究的热点序列。然而,高度变异的特性也会因为种内变异过大而超出种间限制,误导 系统进化关系,最近的研究结果指出,间隔区序列的二级结构以及高水平诊断信号能 够解决间隔区序列潜在的系统进化问题。s c h u l t z 等1 4 3 j 建立y i t s 2 序列的二级结构预测 西南交通大学硕士研究生学位论文第7 页 方法,并对超过5 万条真核生物i t s 2 序列进行研究发现i t s 2 序列具有保守的核心二级结 构,使i t s 2 序列能够在更高水平进行系统进化研究。 i t s 2 序列在植物d n a 条形码鉴定方面同样具有重要的价值,c h e n 掣删对植物界涵 盖1 9 3 个科7 5 3 个属4 8 0 0 个种的i t s 2 序列进行大范围的研究,得出i t s 2 序列在p c r 扩增、 d n a 测序方面具有很大的优势,所研究的药用植物及其近缘种的属和物种鉴定成功率 分别达到9 9 8 和9 2 7 ;g a o 等1 4 5 】对豆科1 9 6 个属的1 1 2 6 个物种的i t s 2 序列进行分析, 正确识别率超过8 0 ;p a n g 等 4 6 1 4 吏m i t s i t s 2 序列对大戟科6 6 个属8 7 1 个物种进行鉴定, 鉴定成功率达到9 0 以上。在此实验基础上可以得出,i t s 2 序列在植物物种鉴定领域 具有重大价值。 2 1 3d n a 条形码鉴定流程 d n a 条形码鉴定最重要的是要找到适合用于鉴定的条形码序列,构建d n a 条形码 鉴定技术平台,制订相关标准,参考相关文献后【4 7 1 ,认为d n a 条形码物种鉴定研究的 基本流程如下: ( 1 ) 采样与鉴定:采集所需样本进行形态学鉴定,记录采集信息; ( 2 ) 设计和筛选通用引物:设计和合成通用引物,提取d n a ,进 y p c r 扩增,比 较筛选通用引物并优化反应条件; ( 3 ) 测序拼接与质量评价:对扩增序列进行测序、拼接,对测得序列进行质量评 价; ( 4 ) 筛选条形码序列:根据种内种间差异及鉴定能力,筛选合适的d n a 条形码序 列或序列组合; ( 5 ) 标准与平台:建立d n a 条形码数据库和相关标准; ( 6 ) d n a 条形码鉴定:通过d n a 条形码鉴定平台实施鉴定。 在d n a 条形码平台和标准建立之后,经过采集样品、通用引物p c r 扩增目的片段 和测序拼接步骤之后就可以通过条形码系统对物种实施鉴定,如果理想的d n a 条形码 扫描仪能够实现,那么将极大减少物种鉴定流程,这对于物种分类鉴定研究具有重要 意义。 对于参j j i d n a 条形码研究的工作者应做好信息采集工作,r a t n a s i n g h a m 和h e b e r t 明确指出提交动物条形码序列应包含以下信息: ( 1 ) 物种名称; 西南交通大学硕士研究生学位论文第8 页 ( 2 ) 凭证标本信息( 目录号和馆藏号) ; ( 3 ) 采集号( 采集人、采集日期平d g p s 定位地点) ; ( 4 ) 标本鉴定人; ( 5 ) c o i 序列至少5 0 0 b p ; ( 6 ) 用于p c r 扩增的引物; ( 7 ) 序列峰图。 植物条形码数据库信息也可以参照此标准进行,并且要求配有照片,以及采集地、 形态特征等有关信息的文字描述【4 8 1 。 2 1 4d n a 条形码技术的局限性 截止目前,植物d n a 条形码尚未达成统一的标准,其应用和研究还处于探索阶段, 并且落后于动物条形码研究,这主要体现在以下几个方面【3 】: ( 1 ) 植物d n a 条形码的选择及其评价仍没有统一的标准。在d n a 条形码的概念 提出之初,科学家们希望能够找到一个短片段来区分地球上的所有物种,在动物界使 用线粒体上c o i 的一段序列作为d n a 条形码,但在某些类群中该序列鉴定能力不佳, 如腔肠动物c m d a r i a 【1 1 。对于高等植物来说,c b o l 在提出将r b c l + m a 作为组合条形码 之后,依然不能实现对物种的全面鉴定f 1 3 。 ( 2 ) d n a 条形码以形态学分类为基础,反过来可以检验形态分类。然而,目前传 统形态分类学和现代分子分类学还未能达到有机的结合。d n a 条形码需依赖传统的形 态分类学,条形码数据库中必须预先确定已知序列标准的物种名称,这在采样时就需 要分类学家对样本进行详细的形态鉴定;建库后,结果验证要以形态分类学结果作为 参照标准。因此,d n a 条形码必须依赖传统形态学分类,并指导和修正传统的形态学 分类。 ( 3 ) 以往的研究采样分布不集中,同一物种的采样量也不足,这就可能产生鉴定 的假阳性结果。d n a 条形码鉴定必须依赖于一个庞大的物种数据库,涵盖尽可能广的 分类类群;同时科属种应当齐全,以避免因采样不均而造成错误鉴定。d n a 条形码的 研究应主要集中在属内物种水平,只有针对具体类群进行探索研究,才有可能为建立 完整的条形码数据库起到积极有效的作用。 因此,今后的植物条形码工作将主要围绕以上几个方面进行展开,一方面,继续 研究适用于植物的条形码序列;另一方面,根据条形码序列指导现行分类标准,对传 西南交通大学硕士研究生学位论文第9 页 统分类进行补充和校正;最后,建立完整的d n a 条形码数据库,对各个类群进行具体 的研究。 2 2 生物信息学在d n a 条形码研究中的应用 生物信息学是2 0 世纪8 0 年代末随着人类基因组计划的启动而兴起的一门新的交叉 学科,它是现代生物科学与信息科学、计算机科学、数学、统计学等学科相互渗透而 形成的,用于对生物科学中各种生物信息的表达、采集、储存、传递、检索、分析和 解读的科学,例如人类基因组测序,使用植物和动物遗传信息中包含的信息来发现和 开发新的药物等。现在,生物信息学已经广泛用于生物学研究,包括基因组分析、转 录组分析等各方面都离不开生物信息技术,并受到生物信息学发展的推动和制约。 生物信息学在d n a 条形码鉴定中起到重要的作用,首先,全世界生物物种众多, 自双名法确立以来的2 5 0 年里,人类共鉴定和描述了约1 7 0 万种生物【4 9 1 ,但这仅仅占到 生物学家预计物种数目的1 5 蚶2 1 ,基于庞大的d n a 条形码数据,必须建立相应的条形码 数据库;其次,需要开发用于实施鉴定的鉴定算法,用于鉴定物种及确定新种;最后, 需要建立用于物种鉴定的网站系统,以便于科学家、法医甚至非专业人士等方便的进 行物种鉴定。因此,d n a 条形码的研究和应用必须有生物信息学的推动。 d n a 条形码序列的数据分析是d n a 条形码探索的重要环节,动物条形码的分析方 法比较成熟,首先进行序列比对和人工校正,使用遗传分析软件( 如p a u p 软件) 计算 种内和种间的k 2 p 距离( k i m u r a 2 p a r a m e t e rd i s t a n c e ,k 2 p ) ,用于表示不同分类阶元之 间的序列变异程度,比较种、属和科3 个水平上的序列差异,然后根据计算结果建立n j 树( n e i g h b o u r - j o i n i n gt r e e ) ,最后依据d n a 条形码遗传距离就能对未知标本进行分类 和鉴定。然而由于植物的种间杂交现象比较普遍,因此植物条形码的分析方法也处于 不断的摸索中。 2 2 1d n a 条形码鉴定算法 d n a 条形码方法不同于形态学的分类方法,它基于在遗传上稳定的d n a 序列来 区分物种,生物在不同的分类等级下其遗传信息具有一定的同源性和相似性,基因突 变的作用又使得序列之间存在变异,突变的随机性和不定向性导致同一类群可能发生 非同一的变异,在碱基组成上产生差异性。根据遗传信息的差异特性,不同的算法根 据其自身的特点,能够产生不同的鉴定结果。常用于条形码技术的算法主要分为相似 西南交通大学硕士研究生学位论文第10 页 性搜索算法、距离算法、等级聚类算法和诊断算法【5 0 1 ,以下对各算法进行概述。 2 2 1 1 相似性搜索算法 b l a s t 及其它相似度的方法将查询序列与参考数据库进行比较,通过两两序列局 部比对或者搜索短的核苷酸字符串来查询数据库中与之最匹配的序列。相似性搜索算 法通常使用相似度得分来评价序列的相似性,而参考序列的性质和匹配长度等信息可 以通过概率值反映出来,比如e v a l u e 。相似性搜索算法弥补了多维标度法和等级聚类 法在d n a 条形码鉴定中的问题,常用的相似性搜索算法有b l a s t 、b l a t 、f a s t a 、 m e g a b l a s t 等,这里主要介绍最为常用的b l a s t 方法。 b l a s t ( b a s i cl o c a la l i g n m e n ts e a r c ht 0 0 1 ) 即“基于局部比对算法的搜索工具”, 由a l t s c h u l 等于1 9 9 0 年发布。b l a s t 优化了本地相似度算法,使用最大片段对得分算

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论