ASD及其在基因选择性剪接检索中的应用_第1页
ASD及其在基因选择性剪接检索中的应用_第2页
ASD及其在基因选择性剪接检索中的应用_第3页
ASD及其在基因选择性剪接检索中的应用_第4页
ASD及其在基因选择性剪接检索中的应用_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、ASD及其在基因选择性剪接检索中的应用ASD及其在基因选择性剪接检索中的应用1 2 3 1 3 吴炳礼 , 杜昆 ,许丽艳 , 李恩民(1 . 汕头大学医学院生物化学与分子生物学教研室 , 汕头 515031 ;)2 . 汕头大学医学院分子生物学中心, 汕头 515031 ;3 . 汕头大学医学院肿瘤病理研究室 , 汕头515031( 摘要: 在生物信息学的飞速发展中, 与之相应的各种类型的数据库不断涌现,选择性剪接数据库Alternative Splicing Database , ) ASD 便是其中之一 。本文详细介绍了 ASD 数据库的主要内容及其功能, 并在其子数据库AltSplic

2、e 中检索 NGAL 基因的选择性剪接 , 由此为例说明了 ASD 数据库在基因选择性剪接检索中的应用 。关键词 : 生物信息学 ;ASD ;AltSplice ; 选择性剪接() 文章编号 :1672 - 5565 2005- 04 - 178 - 04 中图分类号: TP319 ,Q75文献标识码:AASD and a pplication in the search of gene alternative splicing 1 23 1 3WU Bing - li,DU kun,XU Li - yan,L I En - men( 1 . Department of Biochemistr

3、y and Biology of Medical College of Shantou University ; 2 . Moleculer Biology Center of Medical College of S hantou University ;)3 . Department of Tumor Pathology of Medical College of S hantouUniversity shantou 515031 China Abstract :With the fast development of bioinformatics , all kind of releva

4、nt database are keeping appearing , one of which is The Alternative() Splicing Database ASD. This article will detailly introduce themain content and functions of ASD , and then illustrate its applicationin the search gene alternative splicing , by the example of thesearching NGAL in its subunit Alt

5、Splice .Key words : bioinformatics ;ASD ;Altsplice ;Alternative splicing选择性剪接广泛存在于哺乳动物基因转录后 1 ASD 的主页RNA的剪接加工中。在不同的发育阶段、特定组织和疾病 中 , RNA 的 剪 接 模 式 是 多 样 的 。在 人 类 约 输入网址 :http : n nwww. ebi . ac . uk HasdHindex.html 1 40 %,60 %的基因采取选择性剪接方式。因此, 即可进入 ASD 的主页面 。该页面主要由两大模块 有必要系统地收集关于选择性剪接外显子 、内含子 组成 , 即 A

6、SD 的概况 、页面左上角的10 个标题和右( ) 和剪接异构体splice isoform 方面的数据, 并给予注 侧的简 单 快 速查 询 。本 页 还 提 供 了 其 工 作 平 台释。ASD工作组建立的数据库,不仅包括选择性剪()workbench的超连接,为查询内含子序列特性服务。 接事件 , 还包括经实验证明的剪接模式调节机制 。 ( 包括多聚嘧啶序列分析PPT analysis polypyrimidine 到 2003 年 6 月 ,该数据库共收集了 15 644 个基因的 ) ( tract analysis 、分枝点分析BPanalysis branch point162

7、328 个内 含 子 和 122 499 个 外 显 子 。下 面 将 对) ( )analysis 和调节序列分析Regulation sequence 等内ASD 的主要内容作一介绍 。 容 。相应页面可供查询者对目的基因内含子的序列 1 ,2 特征进行查询 。 在本页面列举的两篇文献有助收稿日期 :2004 - 08 - 23 ; 修回日期 :2005 - 06 - 02() () () 基金项目 : 国家自然科学基金39900069 ;30170428 ;30369858, 广东省自然科学基金37788, 广东省自然科学基金990799 , 010431, 广东省高校() () ()

8、自然科学研究项目 200033, 广东省医学科研基金 A2001419, 汕头大学研究与发展基金L0004 ,L00012() 作者简介 : 吴炳礼 1979 - , 男 , 硕士研究生。() 3 通讯作者 : 李恩民 , 教授 , 博士研究生导师, 主要从事肿瘤分子生物学研究 ,Tel : 0754- 8900847 , E - mail : nmli stu. edu. cn于查询者了解该数据库建库的理论分析基础 。目前 于了解其建库思想。1 . 2 . 1 Alt Extron Data ASD 有 Alt Extron 、 Altspice 和 AEdb 等三个子数据库Alt Extr

9、on 的数据来自 EMBL2003 年 2 月发布的 可供使用 。1 . 1 AltSplice 子数据库 版本 , 包含人 、酵母 、鸡 、牛 、果蝇 、拟南芥 、大鼠 、小鼠及斑马鱼等9 个物种 。在这里也列举了这9 个物种 Altsplice 是由计算机产生的经转录证实的关于的关于各类内含子和外显子的统计数据, 如人的选 剪接模式 、选择性剪接事件和相关注释的数据库。择性剪接事件占总数的 46 % 。 1 . 1 . 1 AltSplice data1 . 2 . 2 Alt Extron 的查询界面Altsplice 数据来自 Ensembl 19 . 34b2版本中注释2003 年

10、2 月发布的新版Alt Extron 可查询包括 的已知基因 , 所取的核酸片段包含被Ensembl 证实人 、大鼠 、果蝇 、酵母及拟南芥等5 个物种 。可供查 的基 因 区 域 ,而 这 个 区 域 在 5 和 3 端 又 各 延 伸询的 途 径 有 IDB Accession number 、 EMBL Accession 3000bp , 人类的EST和mRNA序列与这些基因区域) ( number 、 Dataase cross number 如 DNA 、 EST、 PID 等, 进行配对 。依据这些配对进一步分组, 每一组代表在 Splice annotation 的下拉菜单有所

11、有内含子 、外显 一种剪接模式 。每一组由一个代表性的结构来描子的选择性剪接形式 。如果不知道这些数据库的 述 , 称为转录分类。Accession number , 查 询 者 也 可 以 输 入 protein key2 为了描述选择性剪接事件, 每个同形体转录结words , 在输出一系列结果中选择查询目标 。甚至在 构要相互比较 。该数据库认为基本的选择性剪接事查询者对查询目标了解甚少的时候, 可以使用 clone 件 , 有如下四种形式。第一种形式exon isform : 剪接library browser ,在解剖位置、发展阶段、病理学和细供位和口或受位改变导致外显子的延伸或缩短

12、 。第胞类型四个选项下 , 继续选择具体分选项 , 在输出结 二种形式 cassetteexon : 一个外显子只出现在一个转果中选择查询目标。 录体 , 而不出现在这个转录体的同形体中 。第三种1 . 3 AEDB 子数据库 形式 alternating exon : 外显子在选择性转录体中相互AEDB为手工产生的人选择性外显子及其特点排斥。第四种形式intronretention : 一段核酸在一个的数据库 , 该数据是从实验证实外显子的文献中收转录体为外显子, 但在另 外一个转录体中为内含子集而来 。不仅包括核酸序列 , 而且包括已报道的生对于后三者, 根据 5和口或口3'端侧翼

13、的外显子是否物学部分内容: 如组织的特异性 、发育中的调节 、选 () ( ) 有修饰 , 冠以“复杂” complex 或“简单” simple 的特择性外显子的功能 、与疾病的联系等 。这个了数据点 。这些修饰是指如一个侧翼的外显子可能被延伸库可以分别查询选择性外显子的序列及其功能 、调 或缩短 , 或一个在保留内含子侧翼的外显子是“ cas2节剪接的 motif 序列 。 AltSplice 与 AEdb 两个数据库setted ”或者“ alternated ”。的共有条目在 AltSplice 和n或AEdb中的查询结果中1 .1 . 2AltSplice 的查询界面提供人和鼠两个物

14、种将联系起来, 显示于查询结果页面 。这样 AltSplice 的 AltSplice Query界面的中的外显子和选择性剪接事件即可以得到 AEdb 的 超连 接 。可 通 过REGION , GENE两个项目进行查实验性证据。 询 。在 REGION ,可以选定染色体号码, 也可以输入2 . 4 Wrapper and Tools 具体碱基位置; 在 GENE ,既可以使用基因在几个主wrapper 为可以在 AEdb 和 AltSplice 这两个数据要大型数据库中的 ID 或Accession , 也可以使用关键库中同时进行整合查询的平台 , 目前有上述9 个物 词进行查询 , 这几个

15、大型数据库指 Ensembl , EMBL ,种可供查询 。 Tools 即前述的 workbench , 其超连接可Swiss - Prot 以及Genbank 等 。例如在“ Limit to genes以进行内含子的多聚嘧啶尾 、分枝点及调节序列的 ( ) keyword s ”输入“ hsp ” , 在输出的一系列结果中 , 查查询 。 询者点击目的基因即可。1 . 2 Alt Extron 子数据库Alt Extron 是由计算机产生的经转录证实的结构 2 AltSplice data 的使用性和选择性外显子和内含子的数据库 。到 2003 年 6月 ,Alt Extron 收集的

16、5 564 个基因中有2 581 个存在下面以本实验室正在研究的一个食管癌相关基( ) 选择性剪接事件 。 Alt Extron 是 AltSplice 的原型 , 更 因 NGAL neutrophil gelatinase - associated lipocalin在( ) 倾向于多方面了解ASD 工作组使用的方法, 并总体 AltSplice datahuman中查询为例,介绍ASD对基因上关注选择性剪接所包含的生物学内容 。在 docu2 转录产物选择性剪接的分析描述 。本实验室曾研究 1 - 4 mentation 中列举了有关方法学的四篇文献有助表明 NGAL 是一种新的食管癌相

17、关基因 , 可能在癌5 - 7 ( ) 入了 AltSplice data human 的查询界面。 细胞的侵润转移中发挥作用。以往研究证实人( ) NGAL 基因的转录产物有7 个外显子 , 但第七个外2 . 2 AltSplicedata human的查询界面显子不编码蛋白,而NGAL在小鼠中的同源物24P3该界面设计简单明了 , 可供查询栏目有几个大型基因有6个外显子,其第六个外显子相当于人 NGAL数据库的ID HAccession和gene keyword 等。在EVENTS 8 ,9的第六、七外显子合而为一。中有simple ,complex 和 both 三个选项,在未知具体选择

18、性剪接形式时,默认为“both”。我们在“ limit to gene 2 . 1 进入AltSplice data查询界面()在 ASD 的主页点击 AltSplice , 将显示 AltSpli cekeyword s ” 中 输入“NGAL后,点击“submit ”。经上述步骤后得到一个输出结果,见图1 。的两个子目录Data和Access ;点击Access 进入AltSplice Data Interfaces , 点击 Human 的超链接,就进AiMWU. tn J H.Fn 0J HRu; Hcriii EWirtMTWi M- *2 .晔 Z.E.i :图1查询结果条目()(

19、) 即NGAL ,其为条目 中有Ensembl gene id 和简短描述。点击 LCN2 ID 2Ensembl gene id 的超连接,即可进入一个罗列具体查 ENST00000341046,有6个外显子,长度为597bp ,翻询结果的页面,主要有Gene : ENSG00000148346和译产物长度为198个氨基酸。转录结构示意图见图Transcript ID : ENST00000177480 等。这些均 为超连4 。同样由图可知LCN2的转录前体长为3.60kb 。接,点击可到其相应页面查看。Gene : ENST00000277480 与 ENST00000341046相比,在

20、ENSG0000014834新 一 个 Ensembl Human Geneview转录水平上,前者比后者多239bp ,其中在5'端前者页面,包括 Ensembl Gene Report 和 Transcript HTransla2 比后者多 87bp , 在 3端多152bp ; 在翻译水平上 , 前 tion Summary 两大模块 。前者包含的信息有基因名 者的第一外显子的部分序列 , 第五外显子最后一个称 、染色体位置、直系同源物和SNP等,而Transcript 口碱基及第六、七全部序列没有翻译成蛋白 , 后者的六Translation Summary 在 NGAL 查

21、询 结 果 中 包 含 两 部 个外显子皆可翻译成蛋白 , 两者的蛋白序列相差6分 : 个残基 。由上述信息可知 ,NGAL 基因转录产物可() 能有两种不同的加工形式, 产生两种不同的产物。 1ENST00000277480 ,含有 7 个外显子 , 长度为836bp , 翻译产物长度为 192 个氨基酸 , 还有相似性这与本实验室以往的研究结果相吻合。( ) 配对 , 蛋白特点和转录结构见图 2 等 。由图 2 可 与其他数据库相比 ,ASD 的优点是许多资源是知 ENST00000277480 转 录 前 体 长 为 4 . 02kb 。点 击从文献中收集获得,数据经实验室证明,具有很高

22、的ENST00000277480相对应的Exoninformation , 可查看 可信度 。其缺点是, 不能输入序列直接进行查询 , 查 其外显子信息,见图3。由表格可得ENST00000277480询者需对查询目的基因有一定的了解 , 如名称 、一些的七个外显子序列 , 其中第一个外显子5端部分序数据库的 ID 等 , 但从整体来说,ASD与EB I、SWISSFU及第六、七个外显子全部序列在电脑屏幕界面上 - PROT 等其他数据库有超连接, 提供丰富的生物显示为紫色, 示意这些序列为转录非翻译区 , 这与图信息学内容 , 不失是个查 询基因选择性剪接的好数2是一致的:七个外显子中第一外

23、显子部分,第六、据库七个外显子为空白框架,区别于黑色的转录翻译区I lOlLL图2 ENST00000277480转录结构示意图()下转第184页expression patterns with a complementary DNA microarrayJ . Science , 8 Jian - Xun FENG , Sheng - Jian J I , Yong - Hui SHI ,et al . Analysis of()2 five differentially Expressed Gene Families in Fast Elongating Cotton fi1995 ,27

24、0 5235:467 - 470 .2 Diatchenko L ,Lau YC Campbell AP ,et al . Suppression Subtractive Hy2 () ber J . Acta Biochim et Biophysica Sinica ,2004 ,36 1:51 - 57 .bridization :A Method for Generating Differentially Regulated or Tissue Ramamurthy Mahalingam ,AnaMaria Gomez - Buitrago ,Nancy Eckardt , 9et al

25、 . Characterizing the stress n defense transcriptome of ArabidopsisJ . - Specific cDNA Probes and Libraries J . Proc Natl Acad Sci ,1996 ,()Genome biology ,2003 ,4 :20.93 12:L6025 - 6030.3 Robin L .Stears , Todd , Martinsky , et al . Trends in microarra analysis 10 Jasmin doll ,Bettina Hause , Kir川

26、Demchenko ,et al . A Member of the()Germin - Like Protein Family is a Highly conserved Mycorrhiza - Spe2 J . Technology Trends ,2003 ,9 1:140 - 145 .()4 Yang GP , Ross DT , Kuang WW ,et al . Combining SSH and cDNA mi2 cific Induced Gene J . Plant and Cell Physiology ,2003 ,44 11: 1208- 1214 . croarr

27、ays for rapid identificatio of differentially expressed genesJ . Nu 2Cheol Seong Jang , Tong Geon Lee ,Jae Yoon Ki ,et al . The molecular cleic Acids Res. ,1999 ,27 :1517 - 1523 . 11(characterization of a cDNA encoding the putative integral membrane5 Shim KS ,cho SK ,Jeung JU ,et al . Identification

28、 of fungal Magnaporthe) ( ) protein , HvSec61a ,expressed during early stage of barley kernel devel2 griseastress - induced genes in wild rice Oryza minuta J . Plant() opment J . Plant Science ,2005 ,168 :233 - 239 . CellRep . ,2004 ,22 8:599 - 607 .Sam Lievens ,Sofie Goormachtig and Marcelle Holste

29、rs ,A critical evalu2 voiblet C ,Duplessis S , Encelot N , et al . Identification of symbiosis - 6 12ation of differential display as a tool to identify genes involvedin legume regulated genes in Eucalyptus globulus - Pisolithus tinctorius ectomy2 nodulation :looking back and looking forward J . Nuc

30、leic Acids Re 2 corrhiza by differential hybridization of arrayed cDNAs J . Plant J . ,() searc ,2001 ,29 17:3459 - 3468 . () 2001 ,25 2:181 - 191 .Fangming Xiao , Xiaoyan Tang , and Jian - Min Zhou , Expression of孙洪波 , 王国英 , 孙振元 , 等 , 应用抑制差减杂交法分离粗枝大7 1335S : Pto Globally Activates Defense - Related

31、 Genes in tomatoPlantsl ()叶黄杨幼苗的冷诱导表达基因J .中国农业科学,2005 ,38 1: J .Plant Physiology ,2001 ,126 :1637 - 1645.135 - 139 .()上接第180页图 3 ENST00000277480 的 Exon inf ormation图4 ENST00000341046转录结构示意图许丽艳,李恩民,熊华淇,等.NGAL基因在永生化食管上皮细5 () 参考 文献References:胞恶性转化中过表达的研究J .生物化与生物 物 理进展,2 T. A. Thanaraj , Srefan Stamm , Francis Clark , et al .ASD

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论