已阅读5页,还剩53页未读, 继续免费阅读
(动物学专业论文)基于核糖体rna基因的甲螨分子系统学研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
独创声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究 成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经 发表或撰写过的研究成果,也不包含为获得( 注:如没有其他需要 特别声明的,本栏可空) 或其他教育机构的学位或证书使用过的材料。与我一同工作 f 的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 一魏搀i 一字: 学位论文版权使用授权书 孑辜陟 本学位论文作者完全了解堂撞有关保留、使用学位论文的规定,有权保留并 向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权 生盐可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、 缩印或扫描等复制手段保存、汇编学位论文。( 保密的学位论文在解密后适用本授权 书) 学位论文作者签名: 捣i 导师签字: 亭筝喙 签字日期:2 0 0 7 年月( ,e t签字日期:2 0 0 7 年二月p 日 山东师范大学硕士学位论文 中文摘要 基于核糖体r n a 基因的甲螨分子系统学研究 本研究对甲螨目6 科各1 个代表种分别进行核糖体r n a 基因1 8 sr d n a 部 分序列( 约5 4 0 b p ) 、2 8 sr d n ad 3 区( 约3 5 0 b p ) 扩增测序,以i s c h y r o p s a l i s l u t e i p e s ( g e n b a n k 序列号u 9 1 4 9 7 ) 为外群,对所得序列及联合数据结合c j e n b a n k 搜索得到的序列进行分析,并分别应用最大简约法f m p ) 、最大似然法f m l ) 和邻 接法( n j ) 重建分子系统树,进行甲螨的分子系统学研究。研究结果如下: 采用7 0 7 醇保存的新鲜标本( 约2 0 m g 左右) ,分别用改进的十六烷基三甲 基溴化铵法( c t a b ) 、氯化钠法( n a c l ) 、十二烷基磺酸钠法( s d s ) 、醋酸钾法f r , a e ) 和试剂盒法提取甲螨基因组d n a ,结果均能提取出总d n a 。电泳检测结果表明 提取获得的数量较少;p c r 结果显示总d n a 作为模板均可扩增出目的条带,但 是对模板用量比较敏感,可见提取基因组d n a 的纯度较低。 通过引物设计、p c r 扩增、切胶回收、测序分别获得1 8 sr d n a 部分序列和 2 8 sr d n ad 3 区序列各6 条。测序结果在n c b i 上作b l a s t 相似性搜索,确定 获得的是目的序列。 对所得序列及外群共7 条序列进行组成分析:1 8 sr d n a 部分序列长度为 5 4 7 5 5 0 b p ,仅有约4 h , 差异;碱基含量差异不显著;甲螨两两序列差异百分数 为:1 1 o - 6 o 。2 8 sr d n ad 3 区序列长度为3 4 6 3 5 t o p ,最大差异为1 l b p ;碱 基含量差异不显著;甲螨两两序列差异百分数为:2 0 o - 1 1 8 。由此可见,两段 序列在甲螨耳内存在一定的变异。 1 8 sr d n a 部分序列具有3 1 个简约信息位点,占碱基位点总数的5 6 32 8 s r d n ad 3 区序列简约信息位点为3 6 个,达1 0 。1 ,信息含量比较丰富。平均转 换,颠换比分别为1 9 和1 6 。其中两两序列间转换发生的次数几乎均大于颠换次 数,碱基替换未达到饱和,适合于系统分析。p t p 检验均为p = 0 0 0 1 ,也说明 数据符合简约假设,所有的原始数据均含有较强的发育信息。两段序列用于系统 发生分析,前者部分结果与传统观点相互矛盾,后者则基本一致。因此,1 8 sr d n a 部分序列意义有限;而2 8 sr d n ad 3 区序列可作为非常有用的遗传标记,以研 究甲螨目高级阶元的系统发生。 根据形态特征分类,真卷甲螨科和卷甲螨科同属折甲螨总群,重建分子系统 山东师范大学硕士学位论文 树一致强烈支持真卷甲螨科和卷甲螨科相聚;菌甲螨科、副大翼甲螨科同属有翅 甲螨总群,基于2 8 s 和1 8 s + 2 8 s 数据的系统树一致支持菌甲螨科和副大翼甲螨 科聚合,并具有相对较高的置信度。传统演化观点认为,折甲螨总群为原始类群。 在分子系统研究中,m p 和m l 树一致支持真卷甲螨科和卷甲螨科合并后单独形 成一支。但是,与n j 树结果不一致。 本研究发现m p 分析的结果不够稳定;在基部分支上,m p 和m l 分析结果 趋向一致:n j 树的拓扑结构得到了系统分类学的支持,与m p 和m l 树相比, 除个别分支外,置信度相对较高。所以,n j 树结果可能更接近事实。 选用2 8 sr d n a d 3 区序列,添加辐螨目和革螨目各2 条序列,以l s e h y r o p s a l i s l u t e i p e s 为外群,组成1 1 条序列,采用m p 、m l 和i j 分析重建系统树,进一步 研究折甲螨总群的系统地位。m p 和n j 分析一致显示折甲螨总群与其他甲螨类 群聚为一支,再与辐螨目相聚。而m l 分析则支持折甲螨总群先与辐螨目相聚, 再与其他甲螨类群聚为一支。因此,研究表明折甲螨总群属于真螨类,根据n j 分析结果推测应该归属于甲螨目,支持传统观点。 关键词:甲螨目;折甲螨总群;1 8 sr d n a 部分序列:2 8 sr 】淤a d 3 区; 分予系统学 2 山东师范大学硕士学位论文 am o l e c u l a rs y s t e m a t i e sr e s e a r c ho f o r i b a t i d ao nt h eb a s i so f t h e r n a g e n eo f r i b o s o m e a b s t r a c t t h i sr e s e a r c hc h o s eo n er e p r e s e n t a t i v es p e c i e sf r o ms i xf a m i l i e so fo r i b a t i d a , a d o p t e dt h em e t h o do fp c rt oe x t e n da n dd e t e r m i n e dt h ep a r t i a ls e q u e n c e so f1 8 s r d n aa n dt h es e q u e n c e so f2 8 sr d n ad 3a r e a , u s e dt h ei s c h y r o p s a l i sl u t e i p e s ( t h e n u m b e ro fg e n b a n ki su 9 1 4 9 n 勰ao u t g r o u p c o n t r a s t e da n da n a l y s e dt h er e s u l t s w i t hm p , m i , a n dn jt oc o n s l m c tt h em o l e c u l a rs y s t e mt a e e c o m p a r e dw i t ht h e t r a d i t i o n a lt a x o n o m yo f a n a g e a e s i s w es t u d i e dm o l e c u l a rs y s t e mo f o r i b a t i d a t h er e s u l to f t h er e s e a r c hs h o w e dt h a t ;u s e dt h ee t h a n o lo f7 0 ( a b o u t2 0 m g ) t o c o n , s e r v et h e 缸s hs a m p l e s ,a d o p t e x lf i v em e t h o d s ( c t a b ,n a c i ,s d s ,k a ca n d r e a g e n tb o x ) t od i s t i l lt h eg e n o m ed n a o fo r i b a t i d 色t h r o u g ht h e s cf i v em e t h o d s a l l c o u l da c q u i r et h ew h o l eg c n o m ed n a , b u tt h eq t m a t i t i e so ft l a e mw 雠s m a l l a st h e t e m p l e to fp c r , t h e ya l lc o u l de x t e n dt h ea i mb a n d s a l t h o u g hi tc a nb es 嘲t h a tt h e p u r i t yo f t h ed i s t i l l e dg c n o m ed n aw a sl o w t h r o u g hd e s i g n e dt h ep r i m e r s ,i , c r , g e lp u r i f i e d , d e t e r m i n e dt h es i xp a r t i a l s e q u e n c e so f1 8 sr d n a ( a b o u t5 4 0 b p ) ,t h es e q u e n c e so f2 8 sr d n ad 3a r e a ( a b o u t 3 5 0 b p ) s e a r c ht h er e s u l to f t h es e q u e n c e so nt h en c b if o rt h es i m i l a r i t yo f b l a s t , c o n f i r mt h eo b t a i n e rw g l et h eg o a ls e q u e n c e s a n a l y z e dt h et o t a l7s e q l e n e e s ( i n c l u d i n gt h eo u t g r o u ps e q u e n c e ) :t h el e n g t ho f p a r t i a ls e q u e n c e so f1 8 sr d n a v a r i e sf r o m5 4 7b pt o5 5 0b l , ,o n l y4b pd i f f e r e n t ;t h e d i f f e r e n c eo f t h ec o n t e n to f b a s ew a sn o to b v i o u s ;t h ep e r c e n td i f f e r e n c ei nn u e l e o t i d e s e q u e n c eb e t w e e ne v e r yt w os e q u e a e e so fo r i b a t i d aw e r e1 1 , - 6 o t h el e n g t ho f s e q u e n c eo f 2 8 sr d n ad 3a r e av a r i e sf r o m3 4 6b pt o3 5 7b p ,a n dt h em o s td i f f e r e n c e o f l e n g t hw 雒1 1 b p ;t h ed i f f e r e n c eo f t h ec o n t e n to f b a s ew 觞n o to b v i o u s ;t h ep e r c e n t d i f f e r e n c eb e t w e e ne v e r yt w os e q u e n c e so fo r i b a t i d aw e l e2 o - 1 1 8 t h u si tc a n b es e e n , t h ev a r i a t i o nd e g r e eo f t h et w os e c - t i o n sa l - ed e f i n i t ea m o n go r i b a t i d a t h e r ea r e31p a r s i m o n yi n f o r m a t i v es i t e si nt h elg sr d n a s e q u e n c e a b o u t5 6 o ft h et o t a ln u m b e r so fb a s e t h e r ea r c3 6p a r s i m o n yi n f o r m a t i v es i t e si nt h e2 8 s 3 山东师范大学硕士学位论文 r d n a d 3a r e a , 1 0 1 o f t h et o t a ln u m b e r o f b a s e a n dw ec a ns t h en u m b e ri sl a r g e t h ea v e r a g er a t eo f t r a n s i t i o n t r a n s v e r s i o nw e r e1 6a n d1 9r e s p e c t i v e l y t h e r c i n t o , t h et i m e so ft r a n s i t i o nb e t w e e nt w os o q l l n sw e r em o r et h a nt h et i m e so ft r a n s v e r s i o n t h ed e g r e eo ft h eb a s e sd i s p l a c ew a sn o ts a t u r a t e da n df i tf o rt h es y s t e m a n a l y s e s t h er e s u l t so fp 1 p t e s tw 戳a l ls i g n i f i c a n t ( p - - - - o 0 0 1 ) a l s op r o v e dt h a tt h e d a t aw o r ea c c o r d i n gw i t hp a r s i m o n yh y p o t h e s i s 。a ht h eo n g i n a ld a t ah a v es t r o n g g r o w t hi n f o r m a t i o n u s e dt h et w os e c t i o n st od i s c u s ss y s t e mp h y l o g e n e s i s , p a r t i a l r e s u l t so ft h ef o r m e rc o n f l i c t e dw i t ht h et r a d i t i o n a l ,b u ta l lt h o s eo ft h el a t t e rw e r e c o n s i s t e n tw i t ht h eu a d i t i o n a l t h e r e f o r e ,t h es i g a i f i c a n e eo ft h ep a r t i a ls e q u e n c e so f 1 8 sr d n ai sl i m i t e dt os t u d ys y s t e mp h y l o g e n e s i so fo r i b a t i d aa d v a n c e dg e p s ,b u t t h a to f t h e2 8 sr d n ad 3a r e aw a s v e r yb i g a c c o r d i n gt om o r p h o l o g i c a lc h a r a c t e r s ,e u p h t h i r a c a d d a ca n d p h t h i r a c a r i d a ea r e b o t hb e l o n g i n gt op t y e h o i do r i b a t i dm i t e s a l lt h ep h y l o g e n e s i st r e e sa r ec o n s i s t e n t w i t he u p h t h i r a c a r i d a ea n dp h t h i r a c a r i d a cb e i n gc l u s t e r e dt o g e t h e r p t e r o g a s t e r i n e o r i b a t i dm i t e si n c l u d es c h e l o f i b a t i d a ca n dp a r a k a l u m n i d a c ,w h i c hw a sp r o v e db y p h y l o g e n e s i s t r e e so nt h eb a s i so ft h e2 8 sa n d18 s + 2 8 sd a m i nt r a d i o n a l e v o l v c m c n m lv i e w s ,p t y c h o i do r i b a t i dm i t e sw e r et h eo r i g i n a l ,w b i e hw a se o n s i f i e n t w i t hm o l e c u l a rs y s t e m sr c s e a r c h , b e c a u s ee u p h t h i r a e a r i d a ca n dp h t h i m c a d d a e c l u s t e r e ds e p a r a t e l y0 1 1t h em pa n dm lt r e e s b u tt h er e s u l t so nt h en j 扛d i dn o t a g r e ew i t ht h a t i nt h i sr e s e a r c h , w ec a ns e et h a tt h er e s u l t so fm ps y n t h e s i sa r cn o tv e r ys t a b l e ; o nt h eb a s i cb r a n c h , i ti sa l w a y ss i m i l a ro nt h em pa n dm lt r e e ;t h es t r u c t u r eo f n j t r e ew a sc o n s i s t e n tw i t hs y s t e mt a x o n o m y , a n di t sb o o t s t r a pc o n f i d e n c el e v e lw a s h i g h e rt h a nt h a to fn i pa n dn t lt r e e s ot h er e s u l t so fn jt r c cw e r ep r o b a b l ym o r e r e l i a b l e u s e d2 9 sr d n ad 3a r e as e q u e n c e st od i s c u s sp t y c h o i do f i b a t i dm i t e s p h y l o g e n ys t a t u s a d o p t e dn i p , m la n dn j t h r e em e t h o d st od e a lw i t ht h ed a t af r o m 1 1r e l a t i v es e q u e n c e so f a r a c h n i d aa v a i l a b l ei nt h eg e n b a n k t h er e s u l t so f n i pa n d n ja n a l y s i ss h o w e dt h a tp t y c h o i do r i b a t i dm i t e sf i r s tc l u s t e r e dw i t ho t h e rf a m i l i e so f o d b a f i d a , t h e nw i t hp r o s t i g m a t a b u to nt h em l t r e ep w c h o i do r i b a t i dm i m sc l u s t e r e d 4 山东师范大学硕士学位论文 w i t hp r o s t i g m a t af i r s t l y , t h e nw i t ho t h e rf a m i l i e so fo r i b a t i d a s op t y c h o i do r i b a t i d m i t e sm u s tb e l o n gt oa c a r i f o r m e s , a n ds h o u l dp r o b a b l yb e l o n gt oo r i b a t i d a , w h i c h a c c o r d e dw i t ht r a d i t i o n a lv i 掣娜 k e y w o r d s :o r i b a t i d a ;d 3f r a g m e n to f 2 8 sr d n a ;s y s t e m i ct a x o n o m y 山东师范大学硕士学位论文 第一部分文献综述 1 分子系统学概述 1 1 产生 系统生物学是探索、描述并解释生物多样性及其分类和演化关系的学科。它 是在分类学基础上发展起来的【1 i 。1 7 5 8 年,瑞典博物学家林奈的历史巨著自然 系统第十版问世,标志着分类学作为- - l q 真正的科学诞生。1 8 6 9 年,达尔文 进化论提出后,分类学家在鉴别种类的同时,开始研究生物之间的相互关系和演 化规律,形成了系统分类学 2 0 世纪5 0 年代以来,随着现代科学的发展,特别是生态学、细胞学、生物 化学、分子生物学的发展,这些学科的成就渗透到系统分类学,产生了新的研究 方向。尤其进入2 0 世纪9 0 年代,分子生物学方法上的突破,给系统分类学带来 了新的活力,分子系统学( m o l e c u l a rs y s t e m a t i c s ) 产生了。 1 2 定义和研究对象 分子系统学是检测、描述并解释生物在大分子水平的多样性及其演化规律的 学科【2 l 。分子系统学有两个重要的理论基础,其一是中性进化理论,认为大多数 分子水平的变异是随机的,生物大分子的结构变异能够放映进化变异的积累。自 然选择在某些方面仍起着积极的作用,导致一些生物大分子的保守结构。其二是 进化速度均衡论,也即分子钟假说,认为生物大分子的进化基本保持一种恒定的 进化速度,分子变异程度能够较好地反映物种进化距离跚。 分子系统学的研究根据生物体分子的特点和分子的研究对象可分为两大类: 以小分子化合物为研究对象的称为小分子系统学,以生物大分子为研究对象的称 为大分子系统学脚大分子系统学的研究方法归纳起来共有四大类:( 1 ) 直接测定 生物体内信息分子( d n a 、r n a 、蛋白质) 顺序的方法;( 2 ) 通过比较生物大分子 的立体结构特征来推测分子之闯和生物类群之间的系统发育关系的立体结构法; ( 3 ) 用简便快速的方法测定信息分子的多态性,再根据一定的理论假设由统计学 方法推断遗传差异的间接测序法;( 4 ) 通过蛋白质、核酸总体相似性研究或提供 对表型信息分子的分析来推测遗传变异情况的表型推断法。 1 2 1 分子标记 6 山东师范大学硕士学位论文 在分子系统学研究中,每个能反映遗传变异、能提供系统学信息的多态位点 称为一个分子标记。分子系统学常用的分子标记有:限制性片段长度多态性 ( r f l p ) ! - “】,单链构型多态性分析( s s c p l 【1 2 】,变性梯度凝胶电泳( d g g e ) ,d n a 指纹图谱技术,扩增片段长度多态性( a f l p ) ,d n a 序列测定。生物体的任何遗 传变异,其根本在于d n a 碱基序列的变异,包括碱基的插入、缺失、置换、颠 换、重排等,利用间接的d n a 系列分析等技术不一定能完全反映d n a 相应部 位的碱基差异,因此d n a 序列的直接测定无疑是揭示遗传变异最为理想的方法 1 3 阍 1 2 t 2 常用基因或d n a 片段 不同的d n a 序列结构和功能上的差异很大,进化速率必然不同。在进行某 一特定的系统学问题研究时,选择进化速率适宜的基因或d n a 片段至关重要。 在进行较高分类阶元的分子系统学研究时,要选择相对保守的基因。在对种间关 系及物种形成的模式和过程进行研究时,则需要选用进化速率较快的基因或 d n a 片段【l6 】用于动物分子系统学研究的基因主要来自线粒体基因组和核基因组 1 7 - 2 n 。 l i n ( 2 0 0 4 ) t 2 2 】认为动物核基因具有线粒体基因无法比拟的优点:( 1 ) 核基因一 般比线粒体基因进化的慢,因此是解决分歧久远的比较好的分子标记:( 2 ) 核基 因重建的进化树普遍有比较高的c i 值,与线粒体基因相比更有助子整棵树的解 析;( 3 ) 核基因的碱基位点速率变异有更高的同质性;( 4 ) 核基因的碱基替代速率 矩阵比线粒体基因的要均匀,没有线粒体基因的碱基替代偏向特征,因此他提出 分子系统学应该关注核基因数据而不是线粒体基因数据。 当前主要应用予分子系统学的待选核基因超过4 0 多种田】,包括r d n a ,单 拷贝蛋白质编码基因,例如e f 1 a ( e l o n g a t i o nf a c t o r - 1 a ,延伸因子l 幻和 e f - 2 ( e i o n g a t i o nf a c t o r2 ,延伸因子2 ) 阳。由于单拷贝基因的靶序列分离和纯化 问题难度很大,现在应用最多的核基因仍然还是核糖体r n a 基因( rd n a ) 。 核糖体r n a ( r r n a ) 是构成核糖体的主要成分,在细胞中约占总r n a 的 8 0 0 r - 8 5 。真核生物的n r r n a 包括大小两个亚基。大亚基主要由2 8 s 、5 8 s 、 和5 sr r n a 组成,小亚基主要由1 8 sr r n a 组成。r r n a 基因在真核生物基因组 中以串联重复方式存在,其中1 8 s 、5 8 s 和2 8 sr r n a 基因组成一个转录元件, 7 山东师范大学硕士学位论文 产生一个前体r n a ,在形成r r n a 时有2 个内转录片段被剪切,第1 段位于5 8 s 和l g sr r n a 之间,第2 段位于5 8 s 和2 9 sr r n a 之间,分别称为i t s l ( i n t e r n a l w a n s e r i b e ds p a c e r1 ) 和i t s 2 ( i n t a m a lt m _ n s c r i b e ds p a c e r2 ) 2 5 柳。5 8 s 和5 sr r n a 基 因序列较短,因此在分子系统学中应用较少,而1 8 s 、2 8 sr r n a 和i t s 的基因 序列在昆虫等分子系统学中得到了广泛的应用 2 9 - 3 4 。2 8 sr d n a 保守序列中含有 1 2 个高变区( d 1 d 1 2 ) ,因此可以用来解决从种到科水平上的系统发生关系口5 删。 1 3 研究方法 1 3 1 分子系统树重建 系统发生( p h y l o g e n y ) 是指一群有机体发生或进化的历史。系统发生树 ( p h y l o g e n c t i ct r e e ) 就是描述这群有机体发生或进化顺序的拓扑结构。根据系统 发生树的具体表达形式,可分为物种( 或种群) 树( s p e c i e so r p o p u l a t i o nt r c e ) - 与基因 树( g e n et r e e ) 。对生物学家来说,重要的是知道某些物种或种群其分歧的历史及 在每一次分歧后趋异时间,当这些历史事件以系统发生树的形式表现时,此时的 系统发生树称为物种( 或种群) 树h 。对任何一类生物,要想知道确切的物种( 或 种群) 树是非常困难的,但我们可以检测这类生物所包含的一些基因的进化关系 来推断物种( 或种群) 树。如果系统发生树是基于一个基因的核酸或氨基酸序列所 建立的,此时的系统发生树就称为一个基因树。基因树有时与物种( 或种群) 树并 不致,特别是在基因组中存在2 个或更多的同样基因的拷贝时【4 习。无论是物 种( 或种群) 树还是基因树,都是用树一样的拓扑结构表示出来,其中将已标明最 近共祖分类单元( t h em o s tr e c e n tc o l n l l l o na n c e s t o ro f t h et a x a ) 所在位置的树称有根 树( r o o t e dt r e e ) ;若树中最近共祖分类单元所在位置未知,则称无根树( u n r o o t e d t r e e ) 。 1 3 1 ,1 重建方法 国内有些学者将利用现有生物的形态或分子生物学数据推断系统发生的过 程称为系统发生树的构建,而一般认为应称为重建( r e c o n s m a c t i o n ) 比较确切。目 前,利用分子生物学数据重建系统发生树的方法很多。在重建时对不同类型的数 据应采用不同的重建方法。 根据所利用的数据类型不同,系统发生树的重建方法亦可分为两大类: ( 1 ) 离散特征法( d i s c r e t e - c h a r a c t e r b a s e dm e t h o d ) ,利用的是具有离散特征状态 s 山东师范大学硕士学位论文 的数据。 所谓离散特征数据( d i s c r e 把c h a r a c t e r d a m ) ,即所获得的是2 个或更多的离散 的值,是赋给某一具体的运筹分类单位的。它可迸一步分为二态特征( b i m r y c h a r a c t e r s ) 与多态特征( m u l t i s t a t ec h a r a c t e r s ) 。前者的离散特征只有2 种可能的状 况,即具有与不具有某特征项,通常用“0 ”或“1 ”表示,如限制性酶切位点、 r a p d 数据等。对后者其离散特征具有3 个或更多的可能状态,如核酸的序列信 息,就某一位点来说组成核苷酸的碱基具有a 、t 、g 或c4 种可能。 离散特征法建树时考虑到每个特征或核昔酸位点在运筹分类单位或d n a 序 列间的进化关系等。如最大简约法( m a x i m u mp a r s i m o n ym e t h o d s ,简称m p ) 、最 大似然法( m a x i m u ml i k e l i h o o dm e t h o d s ,简称m l ) 、进化简约法( e v o l u t i o n a r y p a z s i m o n ym e t h o d s ,箍称e p ) 等。对相似性和距离数据,在重建系统发生树时只 能利用距离法。离散特征数据通过适当的方法可转换成距离数据,因此在重建系 统发生树时既可用距离法,亦可以采用离散特征法。 最大简约法( m p ) 【4 3 。4 习最早是基于形态特征分类的需要而发展起来的,理论 基础是o c k h a m 哲学原则,即解释一个过程的最好理论是所需假设数目最少的那 个。因使用的算法不同而有着许多版本,其中有些已被广泛地用于分子进化研究 中对离散特征数据的系统发生树的重建,如对d n a 序列数据分析。m p 方法利 用的只是对简约分析能提供信息的特征。如在d n a 序列数据中,利用的只是存 在核苷酸序列差异( 至少有2 种不同类型的核苷酸序列) 的位点,这些位点称为简 约信息位点( p a r s i m o n yi n f o r m a t i v es i t e s ) 。利用n i p 方法重建系统发生树,实际上 是一个对给定o y u s 其所有可能的树进行比较的过程。对某一个可能的树,首先 对每个位点祖先序列的核苷酸组成做出推断,然后统计每个位点用来阐明差异的 核苷酸最小替换数目。在整个树中,所有信息简约位点最小核苷酸替换数的总和 称为树的长度。通过比较所有可能树,选择其中长度最小的树作为最终的系统发 生树,即最大简约树( m a x i m u mp a r s i m o n y 廿o e ) 。 最大似然法( m l ) 4 0 i 常被用来检验一些假设,目前较多地用在遗传作图与临 床检验上。因该法是建立在许多假定的基础上,并且获得最大似然估计的解较复 杂,因此限制了它的推广应用。在d n a 分子标记研究中,该技术已被用来重建 由d n a 序列数据及限制性位点数据产生的系统发生树。利用最大似然法来推断 9 山东师范大学硕士学位论文 一组序列的系统发生树,需首先确定序列进化的模型,根据碱基频率的相等或 不等、转换和颠换速率的相等或不等、位点间替代速率异质性的有无以及不变位 点比例的高低等若干特征可以有5 6 种之多。而模型的正确选择也就成为最大似 然法的关键之所在。目前使用较多的是一些相对较简单的模型,如j u k e s - c a n t o r 模型、k i m u r a 二参数模型及一般二参数模型。这些模型都是建立在一定假设基 础上;然后基于一定的模型考虑2 个o t u 序列间的关系,找到支的长度。这个 过程需要寻找在某一进化距离上由第一种序列真正转换成第二种序列的可能性, 并确定在最大可能下的进化距离;接着将多个o t u 所构成的所有可能树作为最 佳树,对重建每个树的统计量进行似然估计:最后通过对树长度的优化,从而获 得最佳树各参数的最大似然估计。 ( 2 ) 距离法( d i s t a n c eb a s e dm e t h o d ) 唧利用的是相似性或距离数据。相似性或 距离数据并不是某一具体分类单元所具有,而是用彼此间的相似性或距离所表示 出来的各分类单位间的相互关系,如免疫学方法与d n a 杂交所得到的只有分类 单元间相似性信息。 距离法利用所有种或运筹分类单位间的进化距离,依据一定的原则及算法重 建系统发生树。如邻结法( n e i g h b o r - j o i n i n gm e t h o d ,简称n j ) 、非加权组平均法 ( u n - w c i g h t e dp a i r - g r o u pm e t h o dw i t ha r i t h m e t i cm e a n s ,简称u p o m a ) 、f i t c h 和 m a r g o l i a s h 法等。 n j 法是s a i t o u 和n e i 于1 9 8 7 年首次提出【4 8 】,可以讲是最小进化法( m i n i m u m e v o l u t i o nm 创b d ) 的简化版。最小进化法要求根据某种替代模型计算序列阅的距 离,从而重建进化距离最小的树,作为对于系统树的最优估计。在重建系统发生 树时,它取消了u p g m a 法所作的假定,认为在进化分支上,发生趋异的次数 可以不同。最近的计算机模拟已表明它是最有效的基于距离数据重建系统发生树 的方法之一与u p g m a 法相比,n j 法在算法上相对较复杂,它跟踪的是树上 的节点( n o d e s ) 而不是o t u s 。在聚类过程中,根据原始距离矩阵,基于其它所有 节点问的平均趋异程度而对每对节点间的距离作了调整,即将每个o t u 的趋异 程度标准化,从而形成一个新的距离矩阵。重建时即将距离最小的2 个终节点连 接起来,在树中增加一个共祖节点,同时去除原初的2 个终节点及其分支,即对 整个树进行了修势。随后,新增加的共祖节点被视成终节点,重复上一次循环。 l o 山东师范大学硕士学位论文 在每一次循环过程中,都有2 个终节点被一个新的共祖节点所取代。整个循环直 到只有2 个终节点时为止。从所得到的系统发生树来看2 个聚在一起的o u t 其所在的终节点到共祖节点的距离并不一定相同。 非加权组平均法( u p g m a ) t 4 9 1 非;0 d 权组平均法是一种较常用的聚类分析方 法,最早是用来解决分类问题的。当用来重建系统发生树时,其假定的前提条件 是:在进化过程中,每一世系发生趋异的次数相同,即核苷酸或氨基酸的替换速 率是均等且恒定的,也就是存在着一个分子钟。通过u p g m a 法所产生的系统 发生树可以说是物种树的简单体现,在每一次趋异发生后,从共祖节点到2 个 o t u 间的支的长度一样。因此,这种方法较多地用于物种树的重建。u p g m a 法在算法上较简单。聚类时,首先将距离最小的2 个o t u 聚在一起,并形成一 个新的o t u ,其分支点位于2 个o t u 间距离的1 2 处;然后计算新的o t u 与 其它o t u 间的平均距离,再找出其中的最小2 个o t u 进行聚类:如此反复, 直到所有的o t u 都聚到一起,最终得到一个完整的系统发生树。 在上述方法中,f a r r i s 和p e n n y 认为距离法所得到的结果要比离散特征法的 差1 5 0 4 ”,f e l s e n s t e i n 和n e i 则认为f a r r i s 和p e n n y 的论据是对距离法的错误理解 【5 2 】。事实上,在有些情况下距离法能得到比离散特征法更正确的系统发生树 1 5 3 4 4 1 在距离法中,u p g m a 比较简单且实用,当使用的距离数据是来源于对含 核苷酸数量较多的多个基因的分析结果时,利用u 】? g m a 法能得到可靠的系统 发生树。在离散特征法中,在不同世系间进化速率相差较大,且进化速率恒定而 树的内支( i n t e r i o rb r a n c h ) 很短的情况下,m p 法并不能对一个真正的系统发生树 做出始终一致的判断【5 5 】。即使有时m p 法能得到一个始终一致的判断,但它获得 一个正确树的效率( e f f i c i e n c y ) 通常要比n j 法和m l 法低。但在:( 1 ) 序列趋异程 度较小( d 0 9 时,c p 值与b c l 值二者是非常相近的。 与自举检验相近的另一种重抽样方法是弃半复制检验( j a c k k n i f er e p l i c a t i o n t e s t ) 圆,同前者的差别仅在于新建的数据集要比原始数据集小,而且不包含重复 位点。有研究表明,在研究的核苷酸数量较少的情况下,即使c p 或b c l 值达 到9 5 ,所获得的结果仍然不十分可信。因此,在研究中应从不同的基因中尽可 能分析较多数量的核苷酸,特别在研究不同生物间进化关系时,因为不同基因遭 受的进化压力不同。此外,衰退,支持指数( d e c a y s u p p o r ti n d i c e s ) 和t - p t p 山东师范大学硕士学位论文 ( t o p o l o g y - d e p e n d e n tp e r m u t a t i o nt a i lp r o b a b i l i t y ) 检验等方法【5 9 】亦可用来分析所得 系统发生树的可靠性。 对系统误差。通常用来降低其对系统发生分析影响,增加所建树可靠性的方 法是:( 1 ) 重新考虑分析时的假定,变换分析方法:( 2 ) 除去树中的长支,因一个 树中若具有许多长支,将会使分析中的误差复杂化:( 3 ) 去除不可靠的数据;( 4 ) 对某些特征或某一特征状态进行加权等。由于在各种建树方法中引起系统误差的 原因不一,具体可参见s w o f f o r d 等【5 9 1 。 1 4 常用分析软件包 分子系统学研究常用的一些统计分析方法,如系统发生树推断及可靠性检验 等
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年AI合作审计评估合同
- 2026年辽宁省大石桥市高二生物下册期末考试考试卷附参考答案【基础题】
- 2026年江西省井冈山市高二生物下册期末考试试卷(考点精练)附答案
- 2026年山东省平度市高二生物下册期末考试模拟卷A4版附答案
- 2025年河南省偃师市高二生物下册期末考试考试卷附完整答案(夺冠系列)
- 2026年河北省黄骅市高二生物下册期末考试试卷附答案(B卷)
- 2026年浙江省临安市高二生物下册期末考试测试卷含完整答案【典优】
- 2026年青海省德令哈市高二生物下册期末考试检测卷及参考答案AB卷
- 2026年河北省武安市高二生物下册期末考试检测卷及答案【真题汇编】
- 2025年河南省义马市高二生物下册期末考试试卷及答案【真题汇编】
- 2024届上海市华二附中物理高二下期末质量检测试题含解析
- 原辅料进货记录表模板
- 年产万吨高精铝合金板带箔及万吨合金锭项目
- 安全生产管理制度执行情况评估表
- 数据总线专业知识讲座
- GB/T 4458.6-2002机械制图图样画法剖视图和断面图
- GB/T 40595-2021并网电源一次调频技术规定及试验导则
- GB/T 16753-1997硅酸盐建筑制品术语
- 高中化学竞赛化学反应速率(新)课件
- CO2点阵激光治疗仪课件
- 2023学年天津南开中学高二物理第二学期期末质量检测试题(含解析)
评论
0/150
提交评论