KEGG数据库中文教程_第1页
KEGG数据库中文教程_第2页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18 号邮编: 102206电话: 86-10-80726868传真: 86-10-80726898网址: KEGG 数据库中文教程博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18 号邮编: 102206电话: 86-10-80726868传真: 86-10-80726898网址: 快速导航1. 这篇教程介绍了什么?2. KEGG 数据库里面有什么?3. 我如何查询某一特定的代谢途径(pathway) 的信息,例如 Glycolysis / Gluconeogenesis?4. 我如何查询某一化合物的信

2、息,例如 Pyruvate?5. 我如何查询 Pyruvate 涉及了哪些生化反应 ?6. 我如何查询某一基因的信息,例如 gltA ?7. 我如何知道 Bacillus subtilis 是否有 gltA?8. 我如何查询 gltA 在其他物种中的同源基因?9. 我如何列出某一代谢途径中涉及的所有的酶?例如cytrate cycle pathway ( TCA 循环)10. 我如何知道人类的 cytrate cycle 中 pyruvate carboxylase 这种酶有多少化合物与其发生相互作用?11. 我如何查询人类由Citrate 生成 Acetyl-CoA 的可能步骤?12. 我有

3、一条未知的序列,如何查询KEGG 数据库中是否有基因或酶与其对应?博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18 号邮编: 102206电话: 86-10-80726868传真: 86-10-80726898网址: 一. 简介代谢 (Metabolism) 是指 细胞 内发 生的 各种 化学 反 应的 总称 。一 个代 谢途 径( Metabolic pathway )包括一系列互相联系的反应(reaction), 反应中的酶 ( enzyme) 以及反应中的前体或者产物(substrate) 。 随着现代生物信息学的进展,我们可以通过计算机来展示,以至预测细胞内的代

4、谢途径。现 在 常 用 的 查 询 代 谢 途 径 的 数 据 库 主 要 包 括 : KEGG( http:/www.genome.jp/kegg/ ), GenMAPP( / ), BioRag( / ) 等。本教程主要介绍 KEGG 数据库的使用方法。KEGG ( Kyoto Encyclopedia of Genes and Genomes )是由日本京都大学和东京大学联合开发的数据库,可以用来查询代谢途径,酶(或编码酶的基因),产物等,也可以通过BLA ST 比对查询未知序列的代谢途径信息。KEGG 主

5、要通过 Web 界面进行访问,同样也可以通过本地运行的 Perl 或 java 程序进行访问,使用很方便。本教程将结合实例来介绍KEGG 数据库的使用方法,希望能您能通过本教程了解KEGG 数据库的基本使用方法。二. 使用方法1.首页打开 KEGG 的首页,我们可以看到KEGG 提供的四个主要的数据库(图1 箭头所示) 。PATHWAY(代谢途径数据库) ,可以查询各种代谢途径。BRITE(代谢通路及同源基因数据库),这个数据与PATHWAY数据库不同的是,可以查询酶和底物之间的关系,也可以查询某种酶的同源基因。GENES (基因数据库) , 可以查询不同的基因或基因组的信息。LIGAND(配

6、体数据库) , 可以查询反应中各种化合物的信息。博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18 号邮编: 102206电话: 86-10-80726868传真: 86-10-80726898网址: 图 1. KEGG 数据库首页如果点击 KEGG2 KEGG Table ofContents 这个链接,则会出现一个类似于网站地图的页面,在这个页面上,我们可以查询各数据库的更新信息,也可快速访问的各个数据库。KEGG 提供点击 KEGGOrganisms 会列出 KEGG 对各物种的代码。 KEGG 使用三个英文小写字母来代表各个物种,例如人类Homo sapiens,

7、代码是 hsa。再如小鼠 Mus Musculus 则是 mmu。2. PATHW AY 数据库的使用在首页上点击 PATHWAY的链接 (或者先选择 KEGG2,再在出现的表格中Database 选项下选择 KEGG PATHWAY) 。您就会看到 KEGG 收录的所有代谢途径信息(图2)。博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18 号邮编: 102206电话: 86-10-80726868传真: 86-10-80726898网址: 图 2. PATHWAY 数据库界面例如如果想要查询Glycolysis / Gluconeogenesis 这个代谢途径(图2)

8、。1) 从首页,或者 KEGG2 的表格界面中进入PATHWA Y 数据库2) 点击 Carbohydrate Metabolism 中的 Glycolysis / Gluconeogenesis新页面即显示出此途径的信息(图3A)。方框中表示的是反应中的酶,例如1,这是酶的 EC number,国际酶学委员会的编号。小圆圈代表的是反应中的化合物,例如-D-Glucose-1P。箭头代表的是反应的方向。虚线表示此反应可以通过中间产物与其他途径发生联系。或者您也可以通过Search PATHWAY for 这个选项直接搜索Glycolysis / Gluconeogenesis的信

9、息。搜索的结果中会显示出满足条件的所有物种的pathway 。博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18 号邮编: 102206电话: 86-10-80726868传真: 86-10-80726898网址: ( A)( B)图 3. 代谢途径图片信息A:Glycolysis / Gluconeogenesis途径的全面信息 B :人类中 Glycolysis / Gluconeogenesis途径的信息如果想要知道人类的Glycolysis / Gluconeogenesis途径的具体信息。博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18

10、号邮编: 102206电话: 86-10-80726868传真: 86-10-80726898网址: 1) 点击此界面左上角的下拉菜单。选择人类Homo Sapiens(human) 2) 点击 Go即可见图 3B 的画面。绿色的方框代表人类含有这种酶,例。你也可以通过下拉菜单旁的 Select按钮自行设置下拉菜单中显示的物种名称。点击标有 的绿色方框,即可显示人类中此酶的信息(图 4)。Entry 是 KEGG中此酶的 ID 。Gene name 是酶的简化名。 Definition 包括酶的通用名称和 EC number。KO是在 KEGG数据中这种酶的同源序

11、列号。 Pathway 中列出了这种酶涉及的代谢途径。此外,还有一些其他的信息,例如编码这种酶的基因在基因组中的位置( Position ),编码酶的基因序列( NT seq)和蛋白序列( AA seq )等。图 4.酶 的信息3. LIGAND 数据库的使用LIGAND 数据库中,可以查询到化合物,反应或者参与反应的酶。可以在上面的搜索框中进行名称查询,也可以在下面的Ligand Relational Database里进行配体或反应关系的查询。例如想要查询数据库中Pyruvate (丙酮酸盐)的信息(图5A)。1) 在 Search COMPAND的下拉菜单中选择Name 2

12、) 输入 Pyruvae3) 点击 Go就会出现图 5B 的画面。在给出的结果中可见它的 entry number( C00022),分子结构,化学式等属性,也可以点击 Entry number 后进入另一个界面查看它更多的信息。博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18 号邮编: 102206电话: 86-10-80726868传真: 86-10-80726898网址: (A)(B)图 5.LIGAND数据库界面及Search Compound 的使用再例如,我们需要查询Pyruvate (丙酮酸盐)所涉及的化学反应的信息(图6A)。1) 在 Search RE

13、ACTION 的下拉菜单选择 Reactant Entry博奥生物有限公司生物芯片北京国家工程研究中心2) 输入 Pyruvate的 entry number, C00022北京市昌平区生命科学园路18 号邮编: 102206电话: 86-10-80726868传真: 86-10-80726898网址: 3) 点击 Go 就会出现 Pyruvate所涉及的反应(图6B)。(A)(B)图 6.Search REACTION的使用博奥生物有限公司生物芯片北京国家工程研究中心4. GENES数据库的使用GENES数据库可以用来查询基因及基因组的信息。北京市昌平区生命科学园路18 号邮编: 10220

14、6电话: 86-10-80726868传真: 86-10-80726898网址: 例如想要查询 gltA (柠檬酸盐合成酶)这种基因的具体信息(图7A)。 1) 在 Search 的下拉菜单选择 Genes(默认,可不选)2) 输入 gltA 3) 点击 Go在出现的结果中即可查得所有编码这种酶的基因(图 7B)。像是第一个结果eco:b0720,eco 是物种名( Escherichia coli K-12 MG1655), b0720 是 entry name 。gltA是基因名,之后还有基因的全称, 以及编码的酶的 EC number 等。物种名可以通过首页上的KEGGOrganisms

15、 来查询。再例如我们想要查询Bacillus subtilis中是否有 gltA这种基因(图 7C)。 1) 在首页的 KEGG Organisms 中找到 Bacillus subtilis的缩写为 bsu2) Search Organism中输入 bsu 3) 再输入 gltA4) 点击 Go 即可查得相应信息(A)博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18 号邮编: 102206电话: 86-10-80726868传真: 86-10-80726898网址: (B)(C)图 7.GENES数据库界面及搜索功能的使用博奥生物有限公司生物芯片北京国家工程研究中心5

16、. KO 数据库的使用KO数据库可以用来查询某一基因的同源基因。北京市昌平区生命科学园路18 号邮编: 102206电话: 86-10-80726868传真: 86-10-80726898网址: 例如如果想要查询gltA的同源基因(图 8) 1)从 KEGG首页进入 BRITE数据库2)点击进入 KO- Pathway-based classification of orthologs(图 8A) 3)在出现的页面上选择Text search(图 8B)4)输入 gltA或者 citrate synthase,按回车键 (图 8C)这样就会显示出 gltA 的 KO 分类 (KO groups

17、) 了(图 8D) 。需要注意的是基因的 KO groups 是按照不同的代谢途径来列出的,所以一个 KO group 可能被列出很多次。点击 KO 序号, 即可查看此类同源基因 (图 8E)。(A)(B)博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18 号邮编: 102206电话: 86-10-80726868传真: 86-10-80726898网址: (C)(D)(E)图 8. KO 数据库的使用博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18 号邮编: 102206电话: 86-10-80726868传真: 86-10-80726898网址

18、: 6. LinkDB的使用LinkDB 可以用来查询多个数据库之间的交互信息。例如,我们想查询cytrate cycle ( TCA 循环)中涉及的所有的酶(图9A)。 1) 在 KEGG 首页上点击 DBGET2) 然后点击表格上的标题LinkDB3) 使 用 Single Entryto Database 这个选项。需要注意From 内填入的内容必须符合db:entry 的格式 , cytrate cycle 是属于 PATHWAY 数据库 ,entrynumber 是 map00020, 所以应该填入PATHWAY :map00020。(如何查询 Pathway 的信息 ,请参见 2.

19、PATHWAY 数据库的使用 )4) 后在 To 这个选项上选择需要查询的数据库Enzyme5) 点击 Go 即可见到结果(图9B)。( A)博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18 号邮编: 102206电话: 86-10-80726868传真: 86-10-80726898网址: ( B)图 9. Single Entry to Database 的使用再例如如果我们想知道人类的cytrate cycle 中 pyruvate carboxylase 这种酶有多少化合物与其发生作用(如图10A)。1) 使用 Multiple Entries to Datab

20、ase这个选项2) 在 From 里输入 cytrate cycle 的代码pathway:hsa00020,再输入 pyruvate carboxylase 在人类中的基因的代码,hsa:5091。(基因的查询请参见前述2.GENES 数据库的使用)3) 在 To 选择 COMPOUND 数据库4) 因为我们需要查询同时满足人类cytrate cycle 和 pyruvate carboxylase 的底物,所以需要点击 and 这个选项。5) 最后点击 Go,即可出现图 10B 的结果。( A)博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18 号邮编: 102206

21、电话: 86-10-80726868传真: 86-10-80726898网址: ( B)图 10. Multiple Entries to Database的使用博奥生物有限公司生物芯片北京国家工程研究中心7. PathComp 的使用北京市昌平区生命科学园路18 号邮编: 102206电话: 86-10-80726868传真: 86-10-80726898网址: PathComp 可以通过计算来预测联系两种化合物的可能的反应途径。例如我们需要人类由Citrate 生成 Acetyl-CoA的可能步骤。1) 在首页上点击进入LIGAND数据库2) 在 Computational Tools 中

22、选择 PathComp(网页的最下方)3) 在 Search against 这个下拉菜单中选择Homo sapiens(Human),如图 11A 4) 在 Enter initial compound里输入 Citrate5) 在 Enter final compound 里输入输入Acetyl-CoA6) 点击 Exec 按钮,会出现图 11B 的画面7) 再次点击 Exec 按钮即可出现图 11C 的结果结果中会列出可能的pathway 中的中间产物和相应的酶的信息。点击即可查询具体资料。( A)博奥生物有限公司生物芯片北京国家工程研究中心( B)北京市昌平区生命科学园路18 号邮编: 102206电话: 86-10-80726868传真: 86-10-80726898网址: ( C)图 11. PathComp 的使用8. BLAST 的使用KEGG 提供了 BLAST工具, 因此可以使用未知的序列,与 KEGG

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论