(生物化学与分子生物学专业论文)hladra基因进化及drb可表达基因调控区snps研究.pdf_第1页
(生物化学与分子生物学专业论文)hladra基因进化及drb可表达基因调控区snps研究.pdf_第2页
(生物化学与分子生物学专业论文)hladra基因进化及drb可表达基因调控区snps研究.pdf_第3页
(生物化学与分子生物学专业论文)hladra基因进化及drb可表达基因调控区snps研究.pdf_第4页
(生物化学与分子生物学专业论文)hladra基因进化及drb可表达基因调控区snps研究.pdf_第5页
已阅读5页,还剩67页未读 继续免费阅读

(生物化学与分子生物学专业论文)hladra基因进化及drb可表达基因调控区snps研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 h l a d r a 基因进化及d r b 表达基因 调控区s n p s 研究 专业:生物化学与分子生物学 硕士研究生:范新兰 导师:徐安龙教授 摘要 随着人类基因组测序的完成,解析人类基因组的全部核苷酸序列,尽可能 全面的寻找功能基因以及阐明在特定基因组区域内的序列差异成为了研究重心。 人类d n a 序列差异大约9 0 表现为单个核苷酸的多态性( s i n g l en u c l e o t i d e p o l y m o r p h i s m ,s n p ) 。由于数量多,分布广泛,具有相当的遗传稳定性,且位于 基因内部的s n p s 会直接影响到基因的表达水平或蛋白质的结构,s n p s 研究逐 渐成为生物学、遗传学等诸多领域如复杂性疾病病因研究、药物敏感性研究甚至 人类进化史研究的主要工具。 h l a 区域是迄今已知的人类最复杂、基因密度最高的区域。h l a 基因的多 态性不仅可用来作为遗传标志研究人类的起源、进化及迁移,还可以研究某一位 点在一群体中所受的自然选择压力情况。本研究就是通过研究h l a d r 表达基 因的单核苷酸多态性,进而揭示基因的进化力量。 我们随机选择了来自不同民族的6 9 个样品,通过p c r 产物直接测序法,研 究了h l a d r a 基因调控区,第一外显子,第一内含子,第二外显子上的多态性。 在长为2 0 9 3 b p 的范围内共发现了3 2 个s n p s 位点,调控区1 5 个,第一外显子1 个;第一内含子1 6 个:第二外显子没有,平均每6 5 b p 出现一个s n p 。在这3 2 个s n p s 当中,有一个位于启动子的保守区w 盒内还有一个非同义突变。与 d b s n p 数据库相比,有1 7 ( 5 3 ) 个s n p s 是新发现的。第一外显子和第二外显 子物种间的k a k s 研究结果显示,k a 均小于k s ,说明第一,第二外显子受负选 择。t a j i m a sd ,f u a n dl i s ,f a ya n dw u 及h k a 检验结果显示调控区和第一内 含子受中性选择。与d p a l ,及d q a l 基因相比,d r a 基因的第二外显子显示 出了很强的保守性,这可能暗示d r a 基因除了参与抗原【类分子的构成外,还 具有其它功能,这种功能的执行不允许该基因第二外显子编码的蛋白有任何的改 中山大学硕士学位论文 受。 同时,我们还研究了h l a d r b 的4 个表达基因的调控区,通过p c r 产物直 接测守法,我们共发现了7 2 个s n p s :d r b i 基因4 5 个,d r b 3 基因1 1 个,d r b 4 基因6 个,d r b 5 基因i o 个,平均每5 6 b p 出现1 个s n p 。在这7 2 个s n p s 位 点中,有一个3 等位基因和3 个非同义突变( c s n p s ) ,与d b s n p 数据库比,7 0 ( 9 7 2 ) 个s n p s 是新发现的,除s n p s 外我们还在d r b i 基因中检测到一个 3 碱基的插k 缺失和两个单碱基的插入缺失。中性检测结果显示d r b l ,d r b 3 基因的调控区受h i t c h h i k i n g 效应。表现出强烈的平衡选择。d r b 4 基因的调控区 也表现出明显的平衡选择这种选择压力有可能作用于调控区本身也有可能是 作用于与其相邻的外显子,通过h i t c h h i k i n g 效应影响到该区域,d r b 5 基因的第 一外显子受很强的正选择,其调控区通过h i t c h h i k i n g 效应,也表现出明显的正选 择, 关键词:h l a d r b 表达基因,调控区,单核苷酸多态性,选择 垒! ! ! ! ! ! ! 一一一 e v o l u t i o no ft h eh l a d r a g e n e a n ds n p so ft h er e g u l a t o r y r e g i o n o fh l a d r b e x p r e s s e dg e n e s m a j o r : b i o c h e m i s t r ya n d m o l e c u l a rb i o l o g y n a m e :x i n l a nf a n s u p e r v i s o r :p r o f a n l o n g x u a b s t r a c 【。 s i n c et h ec o m p l e t i o no fh u m a n g e n o m es e q u e n c i n g ,a n a l y z i n gt h ew h o l eg e n o m e s e q u e n c e t of o u n do u tf u n c t i o n a lg e n e sa n dp o l y m o r p h i s m sh a sb e e nar e s e a r c hf o c u s a b o u t9 0 o fd n a p o l y m o r p h i s m sa r es i n g l e n u c l e o t i d ep o l y m o 叩h i s m s ( s n p s ) , w h i c hi s p o w e r f u l m a r k e r sf o rs t u d y i n gc o m p l e xd i s e a s e s ,d r u gs u s c e p t i b i l i t ya n d e v e ne v o l u t i o n a r yh i s t o r yo fh u m a n p o p u l a t i o n s h l a r e g i o ni st h em o s tc o m p l i c a t e dg e n er e g i o nw i t ht h eh i g h e s tg e n ed e n s i t ya n d d i v e r s i t y t h ep o l y m o r p h i s m so f h l a g e n e sc a nb eu s e da sg e n e t i cm a r k e r s t oc l a r i f y t h em y s t e r i o u so f t h eh u m a n o r i g i n ,e v o l u t i o na n dm i g r a t i o n ,a l s oc a n b eu s e dt os t u d y n a t u r a ls e l e c t i o no f g e n e si nap o p u l a t i o n i nt h i sp a p c r , w e s t u d i e ds n p so fh l a d r e x p r e s s e dg e n e s ,a n dr e v e a l e d t h eh l a d r g e n e s e v o l u t i o nf o r c e w e i n v e s t i g a t e dt h ep o l y m o r p h i s m s o ft h er e g u l a t o r yr e g i o n ,e x o nl ,i n t r o ni ,a n d e x o n2o fh l a d r af r o m6 9s a m p l e so fd i f f e r e n tp o p u l a t i o n sb yd i r e c ts e q u e n c i n g o fp c r p r o d u c t s t o t a l3 2s n p sw e r er e v e a l e da n dt h ea v e r a g ef r e q u e n c yo f s n p s w a so n ee v e r y6 5 b p p o l y m o o h i s m s a r eu n e v e nd i s t r i b u t e d :15s n p si nt h e r e g u l a t o r yr e g i o n ;1 s n pi nt h ee x o n i ;1 6s n p si ni n t r o ni ;e x o n2h a sn o p o l y m o r p h i s m s a m o n g t h e3 2s n p s ,t h e r ew a sac s n pa n das n pf a l li nt h ewb o x b yc o m p a r i n gt h e s ed a t aw i t hs n p si nd b s n p d a t a b a s ei nt h en c b ,i7s n p s ( 5 3 ) w e r en o v e l k a k sa n a l y s e so fd i f f e r e n c es p e c i e ss h o wk al e s st h a nk si nt h ef i r s ta n d s e c o n dr e g i o n s ,i n d i c a t i n ge x o nla n de x o n2u n d e rn e g a t i v es e l e c t i o n t a j i m a sd ,f u a n dl i s ,h k aa n df a ya n dw u st e s ti n d i c a t e dt h er e g u l a t o r yr e g i o na n di n t r o n1a r e u n d e rn e u t r a ls e l e c t i o n c o m p a r e dw i t ht h ed p a i ,d q a ig e n e ,t h es e c o n de x o no f t h eh l a - d r a g e n ei sv e r yc o n s e r v e d i n d i c a t i n gt h a td r a g e n en o to n l ya t t e n dt h e 1 1 1 中山大学硕士学位论文 a n t i g e np r e s e n t a t i o n ,b u ta l s oe x e c u t e a d d i t i o n a lf u n c t i o n m e a n w h i l e w es t u d i e dv a r i a t i o no ft h er e g u l a t o r yr e g i o no ft h e4h l a - d r b e x p r e s s e dg e n e sb yd i r e c ts e q u e n c i n gp c rp r o d u c t s w ef o u n d7 2s n p si nt o t a l :4 5 s n p si nd r b l ,i ls n p si ud r b 3 ,6s n p si nd r b 4 ,a n d1 0s n p si nd r b 5 t h e a v e r a g ef r e q u e n c yo fs n p sw a so n ee v e r y6 5b p a m o n gt h e7 2s n p s ,t h e r ea r ea t r i a l l e l i ca n d3n o n s y n o m e n o u sv a r i a t i o n ( c s n p ) b yc o m p a r i n go u rd a t aw i t hs n p s d e p o s i t e di nt h ed b s n p d a t a b a s ei nt h en c b ,w ef o u n dt h a t7 0 ( 9 7 2 ) o f7 2s n p s w e r en o v e l i na d d i t i o n ,o n e3 - b a s ep a i r si n s e r t i o n d e l e t i o np o l y m o r p h i s m sa n dt w o s i n g l e b a s e p a i r i n s e r t i o n d e l e t i o n p o l y m o r p h i s m s w e r ed i s c o v e r e dw i t h i nt h e r e g u l a t o r yr e g i o no fh l a d r b 1 g e n e t h en e u t r a l t e s tr e v e a l e dt h a tt h er e g u l a t o r y r e g i o n o fd r b1a n dd r b 3 g e n e s a r eu n d e rb a l a n c es e l e c t i o nd r i v e n b y t h e h i t c h h i k i n ge f f e c t ;t h er e g u l a t o r yr e g i o no ft h e d r b 4g e n ei sa l s ou n d e rb a l a n c e s e l e c t i o no b v i o u s l y h o w e v e r ,t h i ss e l e c t i o nm a yb ea c t so nt h es t u d yr e g i o no rm a y b ea c t st h el i n k e de x o n t h ef i r s te x o f lo ft h ed r b 5 g e n ei su n d e rv e r ys t r o n gp o s i t i v e s e l e c t i o n ,b u tt h er e g u l a t o r yr e g i o n i su n d e ra l s o p o s i t i o n s e l e c t i o nd r i v e n b y h i t c h h i k i n ge f f e c t k e yw o r d :h u m a nl e u k o c y t ea n t i g e n ,d r be x p r e s s e dg e n e s ,r e g u l a t o r yr e g i o n , s i n g l en u c l e o t i d ep o l y m o r p h i s m s ,s e l e c t i o n , 第1 章人类基因组单核苷酸多态性的研究进展 第1 章人类基因组单核苷酸多态性的研究进展 第一张人类基因组序列草图已经公布,但序列图只是基于少数个体,它反映 了基因组稳定的面,并未反映其变异或多态的一面,而正是这种多态性,即基 因组序列的差异构成了不同个体与群体对疾病的易感性、对药物与环境因子不同 反应的遗传学基础。因此,研究s n p s ( s i n g l e n u c l e o t i d ep o l y m o r p h i s m s ) 有助于解 释个体的表型差异、不同群体和个体对疾病,特别是对复杂疾病的易感性,以及 对各种药物的耐受性和对环境因子的反应。 人类d n a 序列变异大约9 0 表现为单个核苷酸的多态性( s n p s ) 。大规模 s n p s 的鉴定工作开始于1 9 9 8 年在此之前已有两代遗传标记,即第一代遗传标 记限制性片段长度多态性( r e s t r i c t i o nf r a g m e n tl e n 舒hp o l y m o r p h i s m s ,r f l p ) 和第 二代遗传标记微卫星多态性( m i c r o s a t e l l i t ep o l y m o r p h i s m s ) 。r f l p 是2 0 世纪7 0 年代后期建立起来的标记系统,是指限制性内切酶特异性切割d n a 链,由于 d n a 上一个“点”变异造成的能切开与不能切开的两种情况,从而产生不同长 度的片段( 多态性) 。r f l p 也被认为是s n p s 的前身。微卫星多态性主要表现在2 6 个核苷酸的串联重复,其位点在人类基因组中分布较广,且符合孟德尔遗传规 律,是很好的遗传标记。比之前两种标记系统,s n p s 更稳定、数量更多,双等 位基因标记( b i a l l e l i c ) ,分布于整个基因组中,并且s n p s 与r f l p 和微卫星等d n a 标记不同,不再以“长度”的差异作为检测手段,而是以直接序列的变异作为标 记,这样更易于进行自动化分析。所以,在遗传学分析中,s n p s 己成为继限制 | 生酶切片段长度多态性和微卫星之后的第三代d n a 遗传标记。 l 1 单核苷酸多态性的理论基础 单核苷酸多态性,或简称s n p s 是指在某一人群的正常个体基因组内特定 核苷酸位置上存在不同碱基,且其最低的基因频率大于或等于1 。因此严格 说来单个碱基的缺失、插入不应被认为是s n p s ”。碱基突变分为转换和颠换 两种,转换是指嘌呤突变成嘌呤或嘧啶突变成嘧啶,如a g 、c t 等,颠换是指 嘌呤与嘧啶之间的互换,即a c 、a t 、g c 、g t 。转换发生的频率与颠换之比 总是大于等于2 :l ,主要原因是c p g 的c 是甲基化的,容易自发脱氨基形成胸 第l 页 中山大学顾上学位论文 隙嘧啶t c p g 也因此被成为突变热点。s n p s 可以是双等位、三等位或四等位 基因,但大多数情况下三等位或四等位基因是非常罕见的,因此s n p s 也称为 二态性的遗传变异。s n p s 在基因组中的分布十分广泛,但不同的区域出现的频 率不同在转录序列中s n p s 的频率低于非转录序列中s n p s 的频率而目转录 区的s n p s 非同义突变的频率比其它突变类型的频率要低得多。h a l u s h k a 等根据 对7 5 个基因的检测结果推测人类基因组中约i ,0 0 0 ,0 0 0 个s n p s 位点其中 约5 0 0 0 0 0 个在非编码区,2 0 0 ,0 0 0 4 0 0 ,0 0 0 个s n p s 在编码区,而编码区 中的s n p s 估计只有2 4 ,0 0 0 4 0 ,0 0 0 个是非同义突变口l ,这可能是由于在进化 中选择压力对编码区中的有害突变有抵制作用。 1 2 s n p s 作为遗传标记的优势 i s n p s 的数量多、分布广泛 单核苷酸多态性在基因组中出现的频率很高,据估计每1 0 0 0 个碱基中就会 出现一个s n p ,因此整个人类基因组大约有3 0 0 万个s n p s 。根据s n p s 在基因 中的位置,可分为: ( 1 ) 编码区s n p s ( c o d i n gr e g i o ns n p s ,c s n p s ) ,c s n p s 是 指位于基因编码区并引起氨基酸编码改变的s n p s 。由于e d n a 也可以反映基因 组的突变情况,因此其单个碱基的突变也归为c s n p s ,但应用e d n a 进行s n p s 研究时应考虑到r n a 编辑过程中产生偏差的可能。c a r g i l l 等p j 根据对1 0 6 个 基因的研究结果估计,在人类基因组中c s n p s 共约有2 4 0 0 0 0 4 0 0 ,0 0 0 。( 2 ) 基因周边s n p s ( p e r i g e n i cs n p s ,p s n p s ) p s n p s 是指位于基因内或基因侧翼区 域的s n p s 包括位于编码区引起氨基酸同义突变的s n p s 、内含子中的s n p s 、 m r n a 非编码区的s n p s 。c a r g i l l 等【3 l 估计,人类基因组中p s n p s 共计约2 4 0 , 0 0 0 4 0 0 ,0 0 0 。( 3 ) 基因间s n p s ( i n t e r g e n i es n p ,i s n p s ) ,i s n p s 是指在整个基 因组中位子基因之闯的的s n p s 即j u n kd n a 的s n p s ,人类基因组大部分s n p s 是i s n p s 约2 百万以上。 2 s n p s 适于快速、自动化的筛查和基因分型 组成d n a 的碱基虽然有4 种,但s n p s 一般只有两种碱基组成,所以它是一 种二态的标记,即二等位基因f b i a l l e i i c ) 。由于s n p s 的二态性,非此即彼,在基因 组筛选 s n p s 往往只需+ ,的分析而不用分析片段的长度,这就利于发展自动 第2 页 第l 章人类基因组单核苷酸多态性的研究进展 化技术筛选或检l 坝t l s n p s 。 3 s n p s 在基因组中相对稳定 尽管平均每个个体以1 0 0 个碱基左右的速度进行突变,但由于每一代中每一 核苷酸的变异频率为1 0 4 以及碱基变化的随机性,使得单碱基等位基因十分稳定。 而且大多数的s n p s 来源于物种形成之后、种群出现之前,因此,人类基因组变 异存在于种群内而非种群之间【。 l 3 单核苷酸多态性的检测技术 单核苷酸多态性的检测方法有许多种,最直接的就是利用生物信息学方法从 已有的d n ad a m b a s e 中搜寻s n p s ,常用的分析软件有p o l y b a y e s 和s n p p i p e t i n e 等 1 5 1 。此外,最常用的s n p s 检测还是依赖实验方法,这些方法根据原理可以分为多 种类型,一是根据d n a 构象的不同寻找s n p s :二是基于p c r 以及酶切的方法; 三是杂交方法:四是直接进行测序等川。 1 以构象为基础的方法 单链构象多态 生( s i n g l e - s t r a n dc o n f o r m a t i o n a lp o l y m o r p h i s m ,s s c p ) 一定条件下,单链d n a 具有一定的折叠结构,这种折叠结构是由它的核苷 酸序列决定的。由于基因突变,d n a 分子单链的构象就会发生变化,从而在电 场中具有不同的迁移率,因此可以通过电泳方法检测出来【7 i 。s s c p 适合于检测小 的d n a 片段,其片段长度要求低于5 0 0 b p ,因为d n a 过长,单链形成稳定的发夹 结构的机会较少。当片段为2 0 0 b p 时,单个碱基突变的检出率高于9 0 ,当片段 为4 0 0 b p 时,单个碱基突变的检出率为8 0 以上,随着d n a 片段的长度加大,其 检出率逐渐降低【6 i 。s s c p 的优点是简单易行,仪器要求低,但“差异灵敏度”较 低。另外,d n a 单链在一定温度下可能有多种热稳定性相近的构型,那么电泳 时同一条d n a 分子就可能产生多条带,而且d n a 构象对温度的改变非常敏感, 所以还需要用别的方法对其矫正。 第,页 中山大学颐上学位沦文 变性高致液相色谱法( d e n a t u r i n gh i g hp e r f o r m a n c el i q u i dc h r o m a t o g r a p 蚵, d h p l c ) 高效液相色谱仪的核心部分是d n a 分离柱,带负电荷的d n a 分子通过带正 电荷的流动相被吸附到固定相上。其原理是将来知的d n a 片段与野生型d n a t 昆 合。经加热变性后再使其降温退火,若有突变的d n a ,此时所形成的双螺旋有 两种,即为同源双螺旋和异源双螺旋,基于同源双螺旋和异源双螺旋解链的温度 不同。通过d h p l c 的温度,将系统维持在使异源双螺旋发生变性的温度而同 源双螺旋并未变性的情况,包含错配位点的异源双链区和无错配的同源配对区相 比。其与固定相的亲和力铰弱,将先被洗脱,可以达到分离的晷鹤。s n p s 鹤有 无最终表现为色谱峰的峰形或数目差异因为异源双链的解链温度较低,会先形 成单螺旋d n a 从色谱柱中流出,在色谱图中会形成两个保留时间较短的色谱峰。 该方法不仅增强了分析的精确性和速度,而且不需要配置凝胶。d h p l c 技术灵 敏度高,可以对频率为5 以下的s n p s 进行有效的检测。其缺点为:只能检测出 样品有无突变,而不能测出突变类型,也不能检测出纯合突变:同时,d h p l c 系统非常精密,对试剂和环境要求较高容易产生误差, 2 基于酶切或p c r 的方法 限制性片段长度多态性( r e s t r i c t i o nf r a g m e n t l e n g t hp n | y m o r p h i s m ,r f l p ) 限制性内切酶是一类能测 q d n a 序列上的特异位点( 通常为4 6 b p 的反向重 复序列) ,并在特异位点处切割的d n a 酶类。对于一条d n a 分子来说会产生特定 大小和数目的酶切片段。由于基因的突变会产生或消除某些酶切位点,从而改变 酶切片段的大小和数目,这些酶切片断带型的不同称为限制性片段长度多态性, 并可以通过电泳方法检测出来。因此r y l p 只适于检测酶切位点处的s n p s 。对于 酶切位点以外的s n p s j j 无法捡测。 随机扩增多态性d n a ( r a n d o ma m p l i f i e dp o l y m o r p h i cd n a ,r a p d ) 这是一种基于p c r 检硼p e r i l 物结合位点序列改变的方法,r a p d 一般使用 l o b p 左右( g + c 含量为5 0 7 0 ) 的随机引物进行p c r 扩增,在d n a 模板与随机引物 结合位点处发生的s n p s 碱基变化会影响p c r 扩增效率,从而对于一个特定的引 第4 页 第1 章人类基因组单核昔酸多态性的研究进展 物,会影响p c r 扩增片段的强弱乃至有无,这些差异可经电泳结果反映出来, r a p d 具有操作过程简单耗费的人力物力少,只需极少量的基因组d n a ,无须 借助有害的同位素等优点,因此成为捡测d n a 多态性的有效遗传标记【8 1 。但i l a p d 的影响因素很多,主要是p c r 反应的温度、离子强度及随机引物的长短等,因此 r a p d 只有在条件稳定时,结果才具有重复性和可比性9 。o 】 3 直接测序的方法 直接测序( d i r e c ts e q u e n c i n g ) 通过d n a 测序技术,直接获取目的片段的碱基序列,通过序列间的比较, 可以直接而有效的寻找s n p s ,其检出率可达1 0 0 且可知道s n p s 的位置及突变类 型。一般的测序流程是:p c r 扩增目的片段一纯化、回收一4 种荧光标记( d n t p ) 进行测序反应一纯化去除多余的荧光物质和引物一在测序仪上电泳并用测序软 件分析结果【m i 。随着测序的自动化程度的提高和测序成本的降低,直接测序越来 越多地用于s n p s 的检测与分型。 4 基于杂交的方法 基因芯片技术 基因芯片又称d n a 芯片( d n ac h i p s ) ,是以按照特定方式在每平方厘米范围 内固定大量己知位点的d n a 探针的硅片、玻片或金属片作为芯片,每个探针含 有4 排寡核苷酸,每个寡核苷酸通常由2 5 个核苷酸组成,这4 排探针只有最中间的 一个碱基有差异,分别是c 、g 、a 、t 。待检测样品变性后与探针杂交,然后洗 脱,非互 t d n a 片段将被洗掉,根据分子杂交原理,样品单链d n a 一定条件下 只能与和它的序列完全互补的探针方阵杂交上,然后通过显微扫描,用计算机对 扫描结果进行处理。这样不但可以检出s n p s 的存在,而且可以得到任何部位发 生哪一种突变的信息,达到快速、准确、大样本的s n p s 检测,是具有高度集成 化、并行化、多样化、微型化和自动化的s n p s 检测技术。d n a 芯片是最理想的 s n p s 检测技术,但是该项技术还不够成熟,例如由于杂交条件对不同g c 含量的 d n a 是完全不同的。还没有找到一种普遍性的杂交条件,另外芯片造价高昂。 所需设备贵重,不利于普及应用;一次要进行大量样本的检测,相应的准备工作 第5 页 中山大学硕士学位论文 量也大大增加。 t a q m a n 技术 t a q m a n 技术运用了荧光共振能量转移( f l u o r e s c e n c e r e s o f l a r l c ee n e r g y t r a n s f e r ,f r e t ) 的原理:即供者受者( 引爆者一淬灭者) 染料对彼此靠近时供者所发 荧光由于光谱接近受者而被淬灭,但两者分离时则可检测到供者所发荧光1 。原 理是在p c r 反应中,将供者一受者染料对分别结合至q t a q m a n 探针的两端。探针未 与目标序列结合时,通过f r e t 作用使供者不发荧光;完全互补配对后,由于 t a q m a n d n a 聚合酶具有5 核酸酶活性,可将供者从探针上切下来,其发出的荧 光可用荧光计检测。如果探针与目标序列中存在错配碱基,就会减少探针与目标 序列结合的紧密程度及t a q m a nd n a 聚合酶切割供者的活性,也就影响了供者的 荧光释放量,从而使碱基突变链与正常链得以区分,最后通过检测特征性荧光信 号的强度来分析多态性l 【“。t a q m a n 将检测结合在p c r 反应过程中进行,无须分 离或洗脱过程,提高了速度,并减少了p c r 污染的可能性。其主要不足是:1 ) 采用荧光淬灭及双末端标记技术因此淬灭难以彻底,本底较高:2 ) 采用酶外 切活性,因此定量时受酶性能影响:3 ) 探针标记成本较高,不便普及应用【h i 。 1 4 s n p s 的应用 i s n p s 与基因组制图 基因组制图是基因组学和后基因组学时代的重要内容是基因克隆和基因结 构与功能研究的基础。双等位基因的s n p s 由于其分布广,突变率低,及易于自 动化等特点,成为继微卫星之后最受推崇的作图标记。第一张s n p s 图谱是1 9 9 8 年5 月由d a v i d 在s c i e n c e 上报道的,包罗了基因组内的3 2 4 1 个s n p s ,平均分辨率 达到2 c m ,包括5 8 个间距大于1 0 c m 的s n p s 并将2 2 2 7 个s n p s 定位和作图。而 至1 1 2 0 0 1 年,国际s n p 研究组织( t h es n pc o n s o r t i u m ,t s c ) 与国际人类基因组测序 组织( t h ei n t e r n a t i o n a lh u m a n g e n o m e s e q u e n c i n gc o n s o r t i u m ) 在n a t u r e 上报道了 人类基因组中的1 4 2 百万个s n p s ,使s n p s 的密度为1 1 9 i k b l l 6 l ;s n p s 作图的一般 步骤包括:( 1 ) 获取d n a 序列:( 2 ) 从d n a 序列确定序列标签位点( s t s s ) 和表达序列标签( e s t s ) :( 3 ) ) 扫描s t s s 或e s t s 确定候选s n p s :( 4 ) 检测确 第6 页 第1 章人类基因组单核苷酸多态性的研究进展 定s n p s :( 5 ) 将s n p s 定位于染色体特定位置1 引。 2 s n p s 与复杂性状 人类表型极大数目的变异是由遗传学和环境因子共同影响的,许多临床疾病 都有其遗传因素存在,是由于基因组某一范围突变( 主要是s n p s ) 。一些常见病如 癌症、心血管疾病、精神病、自身免疫疾病、糖尿病等的患病风险很大程度受个 体的一定的关键易感基因内的s n p s 的影响。对孪生、家系的遗传流行病学研究 资料表明在任何环境条件下,遗传因素对疾病的发生有很高的遗传率。如 a l z h e i m e r 病的发生其遗传因素占7 4 。对于复杂疾病,其性状的形成受许多微 效加性基因的作用,单个的疾病相关的s n p s 等位基因对疾病来说既不是必须的, 也不是足够的,而是多个关键基因内的s n p s 联合作用加环境园素而导致的,这 些相互作用的关键基因可以是几个,几十个,或者甚至是几百个。基因间的相互 作用可以是相加、协同或拮抗,引起的病理变化是数量性状而非全或无现象,并 且临床表现的产生有一定的闯值。 3 s n p s 与群体遗传学 群体遗传学是研究群体遗传结构及其变化规律的- - f 学科,其主要的研究工 具是d n a 分子的多态性。人类s n p s 大部分来源于很久以前单个d n a 分子中发生 的单碱基突变。新的等位基因在其产生时就可能被其他一系列多态性位点所包 围,形成一组独特的等位基因( 单倍体) 。在随后的几代中,当周围的染色体区域 复制时,单倍体可保持不变,新的等位基因和每一相邻的多态性标记之间存在连 锁不平衡。所谓连锁不平衡是指:由于连锁的原因,如果群体某一染色体上的两 个不同的多态位点上出现某种特定等位型的概率与随机概率有显著差异,那么这 两个位点之间存在连锁不平衡,连锁不平衡的强度反映了这两个位点之间在染色 体上的距离,以l d ( l i n k a g ed i s e q u i w b f i u m ) 表示,l d 越大,距离越小。这种l d 存在区域分布,反映了特殊的人口统计历史,如瓶颈效应、杂居、近交、迁移和 选择性婚配( a s s o r t a t i v em a t i n g ) 2 0 | 等。由于连锁不平衡的存在,可以用个多态性 标记代替相邻的另一个特殊的多态性等位基因。但是,连锁不平衡并非长期存在, 经过连续几代后,由于减数分裂时多态性位点的重组,导致d n a 分子中不同位 点等位基因重组,连锁不平衡水平会明显降低。同时基因的转换也会影响连锁不 第7 页 中山大学硕士学位沦艾 平衡的水平。因此,连锁不平衡可随时间推移而消失。而单倍体随机漂变移、自 然选择等因素可以保持某些特定区域的连锁不平衡水平【2 1 1 。 4 s n p s 与药物设计 同一药物在不同的个体产生的效果不是完全相同的。这是因为药物在进入人 体后,产生的效果受到吸收、结合、代谢及分泌等差异的影响,而这种差异主要 是遗传差异。基因组的多态性尤其是s n p 多态性能充分地反映个体间的遗传差 异。通过研究遗传多态性尤其是单核苷酸多态性与个体对药物敏感性或耐受性的 相关性,可以阐明遗传因素对药物效用的影响从而对个体化用药和药物开发提 供指导和依据。由于s n p s 广泛存在于基因组中,且判断结果容易编成由0 和l 组 成的数字信号,可实现简捷、高速、大量的分析。因此s n p s 被定位为2 l 世纪 多态性靶位是对基因组进行系统解析和研究不可缺少的信息1 2 ”; 5 s n p s 与人类进化 除上述应用外,s n p s 还大量用于人类进化方面的研究,帮助描述突变进程及 检测正、负选择。y u 等 2 3 i 检测了5 0 个非编码区上的单核苷酸多态性发现非洲 内部群体的核苷酸多样性大于非洲与欧洲人群间的核苷酸多样性,支持了人类非 洲起源学说。w o o d i n g 等利用s n p s 揭示了c y p l a 2 基因受明显的正选择。 1 5 存在问题 s n p s 虽然是当今基因组学中最热门的研究对象之一,它的应用前景也为多 数科学家看好但是从以s n p s 为标记作图,到基于s n p s 的相关分析定位疾病基 因和分析人种起源,都有许多问题留待深入考虑和研究。 1 关联分析中的问题 在s k o k l o s t e r 举行的s n p s 及复杂基因分析首届年会上两个研究组指出在 相关基因定位时,除非发现足够的s n p s ,否则还需要获得人群的相关信息( 如 人群的迁徙等) 。这是因为相关分析是一种依赖频率的技术它的分析结果会受 诸多因素的影响,包括疾病突变和与之相关等位基因标记出现的年代、频率,等 位基因之间的重组率,疾病的病源异质性,标记位点的突变率和杂合度等【2 “。这 第8 页 第1 章人类基因组单核苷酸多态性的研究进展 就为样本设计和s n p s 标记及其密度的选择提出了更高的要求。 2 样本问题 尽管大部分s n p s 出现在各种群体中,但是某一种s n p 可能只出现在一个亚群 中 2 6 i 一些有意义的c s n p s 也以相当高的比例只出现在某一亚群中,所以要 搜寻s n p s 就要尽可能地采用多种多样的大样本。如果能够在全世界范围内采取 各种族的样本是最理想的,但是由于政治、资金等原因限制而成为不可能。因此, 美国国立人类基因组研究所希望通过1 0 0 5 0 0 个来自非洲、亚洲、欧洲和美国 土著人的d n a 样本来收集i o 万个s n p s ,并将这些s n p s 作为路标来建立一张 新的、精密的基因图【2 8 i 。但是这样的图谱并不能代表人类真正的多态性。【2 9 l 3 专利问题 由于s n p 将给疾病防治、法庭科学、药学等带来一场革命,所以众多学术 机构、商业团体纷纷投入这场争夺s n p 的“战役”。对于那些随机选择的s n p s , 问题不是很大,因为在基因组中存在着几百万这样的s n p s 所以也不会很快面 临着全部被私人占有的危险,而对于约2 0 万的c s n p ,利害关系就大多了【1 ”。 因此,美国国立基因组研究所、美国国立卫生研究院以及其他联邦研究机构已加 大投入,抢先获得更多的s n p s ,并将其放在公共数据库中,供公众无偿调用。 4 技术问题 测序和基因突变研究技术的应用大大加快了s n p s 分型的进程,从而使大规 模的遗传分析和基因诊断成为可能。据报道,检测基因突变的方法已有1 0 0 多种, 但是要大规模地进行s n p s 的分析还有待于d n a 芯片技术的进一步成熟。 5 s n p 命名问题 目前没有一个统一标准的命名方法,由于不同s n p 由不同实验室测定,现在至 少存在6 种不同的命名系统。 附录s n p s 的网上资源 目前,可供利用的公开s n p 网上资源主要包括: ( l )美国国立卫生研究院( n a t i o n a l n s t i t u t e s o f h e a l t h ,n i h ) 提供的主要是与癌 第9 页 中山大学顾士学位论文 ( 2 ) 症和肿瘤相关的候选s n p 数据库:h t t p :c g a p n c i n i h g o v g a i ; n i h 开辟的适于生物医学研究的曲s n p 多态性数据 库:h r p :w v v w ,n c b i + h i m n i h ,g o v s n p ; 人类基因组组织机构( h u m a n g e n o m e o r g a n i z a t i o n h u g o ) 维持的突变数 据库:h a p :n a r i e l a c s u n i m e i b ,e d u a u :8 0 - - c o t t o n m d i h t m ; 由美国白头研究所( w h i t eh e a di n s t i t u t ef o rb i o m e d i c a lr e s e a r c hg e n o m e i n s t i t u t e ) 建立的人类s n p 数据:h t t p :h w w w g e n o m e w i m i t e d u s n p h u m a n 一 i n d e x h t m l ; 华盛顿大学( w a s h i n g t o nu n i v e r s i t y ) 支助的按染色体位置组织的s n p 数据 库:h t t p :w w w i b c w u s t l e d u s n p ; 瑞典卡尔林斯卡研究院( k a r o l i n s k ai n s t i t u t eo f s w e d e n ) 建立的h g b a s e 数据 库:h t t p :h g b a s e c g r k i s e ; 国际医药与信息加工公司联合组成的s n p e 究联盟( t h e s n pc o n s o r t i u m , t s c ) 建立的s n p 数据库:h t t p :s n p c s h l o r g d b s n p m a p ; 美国国立环境健康科学研究院( n a t i o n a li n s t i t u t eo f e n v i r o n m e n t a l

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论