生物信息数据库类型3 ppt课件_第1页
生物信息数据库类型3 ppt课件_第2页
生物信息数据库类型3 ppt课件_第3页
生物信息数据库类型3 ppt课件_第4页
生物信息数据库类型3 ppt课件_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

NCBI 生物信息学 曹毅曹毅 生命科学学院生命科学学院 NCBI 第二章第二章 生物信息数据库生物信息数据库 数据库的类型数据库的类型 NCBI * 3 第一节 引言 生物分子数据 高速增长 分子生物学 及相关领域研究人员 迅速获得最新实验数据 建立生物分子数据库 NCBI 序列数据库 结构数据库 基因组数据库 一次数据库一次数据库 DNA序列序列 蛋白质序列蛋白质序列 蛋白质蛋白质 结构结构 人类基因组以及人类基因组以及 其它生物基因组其它生物基因组 生物信息学数据库生物信息学数据库 数据库管理系统数据库管理系统 Oracle/sybase大型计算机服务器大型计算机服务器 大容量磁盘空间大容量磁盘空间 NCBI 序列数据库序列数据库 结构数据库结构数据库 基因组数据库基因组数据库 二次数据库二次数据库 文献数据库文献数据库 专家专家 生物信息学数据库生物信息学数据库 NCBI * 6 v 生物分子数据生物分子数据 库应满库应满 足足 5个方面的主要需求个方面的主要需求 v( 1) 时间时间 性性 v( 2)注)注 释释 v( 3)支撑数据)支撑数据 v( 4)数据)数据 质质 量量 v( 5)集成性)集成性 NCBI * 7 生物分子数据库几个明显的特 征 ( 1)数据库的更新速度不断加快)数据库的更新速度不断加快 数据量呈指数增长趋势数据量呈指数增长趋势 ( 2)数据库使用频率增长更快)数据库使用频率增长更快 ( 3)数据库的复杂程度不断增加)数据库的复杂程度不断增加 ( 4)数据库网络化)数据库网络化 ( 5)面向应用)面向应用 ( 6)先进的软硬件配置)先进的软硬件配置 NCBI * 8 v 生物分子数据生物分子数据 库库 一级数据库一级数据库 v数据库中的数据直接来源于实验获得的原始数据,只经过简单的数据库中的数据直接来源于实验获得的原始数据,只经过简单的 归类整理和注释归类整理和注释 二级数据库二级数据库 v对原始生物分子数据进行整理、分类的结果,是在一级数据库、对原始生物分子数据进行整理、分类的结果,是在一级数据库、 实验数据和理论分析的基础上针对特定的应用目标而建立的实验数据和理论分析的基础上针对特定的应用目标而建立的 。 NCBI * 9 第二节 核酸序列数据库 n 国国 际际 上上 权权 威的核酸序列数据威的核酸序列数据 库库 ( 1)欧洲分子生物学)欧洲分子生物学 实验实验 室的室的 EMBL http:/www.embl-heidelberg.de ( 2)美国生物技)美国生物技 术术 信息中心的信息中心的 GenBank /Web/Genbank/index.html ( 3)日本)日本 遗传遗传 研究所的研究所的 DDBJ http:/www.ddbj.nig.ac.jp/ NCBI 1、核酸序列数据库 n 1988, 由此三家 组 成了国 际 核酸序列数据 库协 作 组织 ( INSDC), 规 定:数据交 换 与共享(每 24小 时进 行一次),使用 统 一的数据 记 录 格式 处 理提交数据,以保 证 各数据 库 相 应记录 在内容上的一致 性,数据的 维护 与更新。 n 三 个数据 库 中的数据基本一致, 仅 在数据格式上有所差 别 , 对 于特 定的 查询 ,三个数据 库 的响 应结 果一 样 。 n 这 三个数据 库 是 综 合性的 DNA和 RNA序列数据 库 ,每条 记录 代表 一个 单 独、 连续 、附有注 释 的 DNA或 RNA片段。 NCBI GenBank: /Genbank/ NCBI EMBL http:/www.embl-heidelberg.de NCBI DDBJ http:/www.ddbj.nig.ac.jp/ NCBI 22 November 2010 Total nucleotides: 301,588,430,608 NCBI 22 November 2010 Number of entries: 199,575,971 NCBI NCBI * 17 NCBI * 18 “ID” 为序列的标识符行,包括登录号、类型,分子的长度 “AC” 为登录号行; “ XX” 为分隔符号行; “ DT” 为 创建和更新日期行 “DE” 为序列描述行; “ KW” 为关键字行; “ OG” 行描述细胞组织; “ OS” 行描述生物体种属; “ OC” 行描述生物体分类信息; “ RN” 描述参考文献的编号 ; “ RP” 描述 参考文献的页码; “ RA” 描述参考文献的作者; “ RT” 描述参考文献的题目; “ RL” 描述参考文献的出处 ; “ RC” 描述参考文献的注解; “ RX” 、 “ DR” 行描述交叉引用信息; “ FH” 为特征开始符号; “ FT” 为特征表行 ( 1) Feature Key,它是描述域生物功能的关键字; ( 2) Location,指明特征在序列中的特定位置; ( 3) Qualifiers,描述关于一个特征的辅助信息; 文件体 由序列本身所组成,由 “ SQ” 标志的行开始。 序列结束的标记是 “ /” 。 EMBL核酸数据库 中的每一个序列数据被赋予一个登录号,它是 一个永久性的唯一标识 EMBL的序列数据用外在的 ASCII文本文件来表示, 而每一个文件分为文件头和文件体两大部分 文件头 由一系列的信息描述行所组成, 文件头实际上对应于一个序列的注释( annotation) NCBI * 19 使用 EMBL ( 1) CD-ROM形式 ( 2) ftp服 务 器 ( 3) Gopher服 务 器 ( 4) WWW服 务 器 这 是目前最常用的一种形式 NCBI * 20 EMBL提供一些与序列相关的 检 索操作(基于 3W 服 务 器) ( 1)序列 查询 最 简单 的 查询 就是通 过 序列的 登 录 号 (如 X58929) 或 序列名称 (如 SCARGC)直接 查询 。 ( 2)核酸同源性搜索 3W服 务 器支持用 户 使用 FastA程序 进 行核酸同源搜索。 FastA根据 给 定的目 标 序列在数据 库 中搜索其同源序列。 NCBI * 21 n 基因基因 组组 数据数据 库库 ( GDB) n 人人 类类 基因基因 组组 数据数据 库库 Ensembl n 表达序列表达序列 标记标记 数据数据 库库 dbEST n 面向基因聚面向基因聚 类类 数据数据 库库 UniGene NCBI * 22 2、 基因组数据库(基因组数据库( GDB) 人类基因组计划所得到的图谱数据 目前 GDB包含对下述三种对象的描述: ( 1)人类基因组区域 包括基因、克隆、 PCR标记物、断点、细胞遗传学标记、易碎位点、 EST、综合 区域、 contigs、重复等; ( 2)人类基因组图谱, 包含细胞遗传学图谱、连接图谱、辐射混合图谱、 contig 图谱、集成图谱,所有这 些图谱都可以被直观地显示出来; ( 3)人类基因组中的变化, 包括基因突变和基因多态性,加上等位基因频率数据。 NCBI * 23 与 染 色 体 相 关 的 信 息 NCBI * 24 其它模式生物基因组数据库 如: 鼠基因组数据库 MGD ( /) 酵母基因组数据库 SGD ( http:/genome- /Saccharomyces/) NCBI * 25 Ensembl (/) 3、人类基因组数据库、人类基因组数据库 Ensembl Ensembl包括所有公开的人 类 基因 组 DNA序列,通 过 注 释 形 成的关于序列的特征。 现 在包括其他基因 组 ,如大鼠、小鼠 、 线 虫、果 蝇 等。 例如:基 因 通 过实验发现 的 或者是通 过 GenScan程序 预测 的 其他的特征: 单 核苷酸多 态 性( SNP)、重复序列等 NCBI * 26 Ensembl 数据库结构图 NCBI * 27 Ensembl提供多种查询方式 通过关键字查询 用 BLAST进行相似序列的搜索 另一种更直观的方式是显示各染色体 用户可以在染色体水平上选择感兴趣的位点, 逐层放大 浏览整个基因组 NCBI * 28 NCBI * 29 人的第 9号染 色体及大鼠对 应的染色体片 段 NCBI * 30 4、表达序列、表达序列 标记标记 数据数据 库库 dbEST EST( Expressed Sequence Tags)方法已被证明是 识别转录序列 的最 有效方法 , EST序列大约覆盖了人类基因的 90%。 DbEST (/dbEST/) 是 GenBank的一个部分,该数据库包括不同生物的 EST序列 数据及其它相关信息,主要是从大量不同组织和器官得到的短 mRNA片段。 WEB页面或 email FTP 有关 EST的数据 dbEST数据库 NCBI * 31 5、面向基因聚类数据库、面向基因聚类数据库 UniGene UniGene( /UniGene/) 数据库将 GenBank中的序列进行自动分类,形成 面向基因群的非冗余集合。 每个 UniGene群包含 : 代表一个唯一基因的多个序列,附有该基因相关的信息, 如基 因表达的组织类型、定位图谱 除了基因的序列之外,还包括大量的 EST序列。 目前, UniGene中包括人类、大鼠、小鼠、牛的相关数据, 因为这些生物有大量的 EST数据。 NCBI * 32 第三节 蛋白质序列数据库 n 目的:目的: 帮助研究者鉴别和解释蛋白质序列信息,帮助研究者鉴别和解释蛋白质序列信息, 研究分子进化、功能基因组。研究分子进化、功能基因组。 n 它是一个全面的、经过注释的、非冗余的蛋白质序列数据它是一个全面的、经过注释的、非冗余的蛋白质序列数据 库。库。 n 所有序列数据都经过整理,超过所有序列数据都经过整理,超过 99%的序列已按蛋白质家的序列已按蛋白质家 族分类,一半以上还按蛋白质超家族进行了分类。族分类,一半以上还按蛋白质超家族进行了分类。 1、 PIR( Protein Information Resource) NCBI * 33 除了蛋白除了蛋白 质质 序列数据之外,序列数据之外, PIR还还 包含以下信息:包含以下信息: (1)蛋白蛋白 质质 名称、蛋白名称、蛋白 质质 的分的分 类类 、蛋白、蛋白 质质 的来源;的来源; (2)关于原始数据的参考文献;关于原始数据的参考文献; (3)蛋白蛋白 质质 功能和蛋白功能和蛋白 质质 的一般特征,包括基因表达、翻的一般特征,包括基因表达、翻 译译 后后 处处 理、活化等;理、活化等; (4)序列中相关的位点、功能区域。序列中相关的位点、功能区域。 NCBI * 34 PIR提供三种 类 型的 检 索服 务 : 一是基于文本的交互式 查询 , 用 户 通 过 关 键 字 进 行数据 查询 。 二是 标 准的序列相似性搜索, 包括 BLAST、 FastA等。 三是 结 合序列相似性、注 释 信 息 和蛋白 质 家族信息的高 级 搜索 , 包括按注 释 分 类 的相似性搜索 、 结 构域搜索等。 NCBI * 35 三个子数据库 NCBI * 36 2、 SWISS-PROT SWISS-PROT (http:/www.expasy.ch/sprot/sprot-top.html) 是目前国际上比较权威的蛋白质序列数据库 ,其中的蛋白 质序列是经过注释的 SWISS-PROT中的数据来源于不同源地: ( 1)从核酸数据库经过翻译推导而来; ( 2)从蛋白质数据库 PIR挑选出合适的数据; ( 3)从科学文献中摘录; ( 4)研究人员直接提交的蛋白质序列数据 NCBI * 37 ( 1) 注释注释 在 SWISS-PROT中,数据分为核心数据和注释两大类。 核心数据包括: 序列数据、参考文献、分类信息(蛋白质生物来源的描述) 注释包括: (A)蛋白质的功能描述; (B)翻译后修饰; (C)域和功能位点; (D)蛋白质的二级结构; (E)蛋白质的四级结构; (F)与其它蛋白质的相似性; (G)由于缺乏该蛋白质而引起的疾病; (H)序列的矛盾、变化等。 SWISS-PROT有三个明显的特点 : ( 2)最小冗余)最小冗余 ( 3)与其它数据库的连接)与其它数据库的连接 NCBI * 38 NCBI * 39 NCBI * 40 提交序列数据 ( a) 编辑电 子表格 ( b) 利用 Authorin程序 ( c) WWW 服 务 器 使用 SWISS-PROT ( a) CD-ROM形式 ( b) ftp服 务 器 ( c) Gopher服 务 器 ( d) WWW 服 务 器( SRS) 与序列相关的操作 ( a)序列 查询 ( b)搜索同源蛋白 质 序列 NCBI * 41 TrEMBL (http:/www.ebi.ac.uk/trembl/index.html) 包含从 EMBL核酸数据库中根据编码序列 (CDS)翻译而得到的蛋白质序列, 并且这些序列尚未集成到 SWISS-PROT数据库中。 TrEMBL有两个部分: ( 1) SP-TrEMBL(SWISS-PROT TrEMBL) ( 2) REM-TrEMBL(REMaining TrEMBL) 3、 TrEMBL NCBI * 42 第四节 生物大分子结构数据库 1、 PDB( Protein Data Bank) 蛋白蛋白 质质 核酸核酸 糖糖 类类 其它复合物其它复合物 n 一种是一种是 显显 式序列信息(式序列信息( explicit sequence) n 一种是一种是 隐隐 式序列信息式序列信息 (implicit sequence) NCBI * 43 Current Holding Data Submit Data Keyword Search Introduction to selected molecular Data NCBI * 44 Download Data PDB File Format Related Software NCBI * 45 HEADER HYDROLASE 19-FEB-97 1ADZ TITLE THE SOLUTION STRUCTURE OF THE SECOND KUNITZ DOMAIN OF TITLE 2 TISSUE FACTOR PATHWAY INHIBITOR, NMR, 30 STRUCTURES COMPND MOL_ID: 1; COMPND 2 MOLECULE: TISSUE FACTOR PATHWAY INHIBITOR; 。 COMPND 8 BIOLOGICAL_UNIT: MONOMER SOURCE MOL_ID: 1; 。 SOURCE 7 EXPRESSION_SYSTEM_PLASMID: PFLAG KEYWDS HYDROLASE, INHIBITOR, COAGULATION EXPDTA NMR, 30 STRUCTURES AUTHOR M.J.M.BURGERING,L.P.M.ORBONS REVDAT 1 25-FEB-98 1ADZ 0 JRNL AUTH M.J.BURGERING,L.P.ORBONS,A.VAN DER DOELEN, 。 REMARK 1 REFERENCE 1 REMARK 1 AUTH M.T.STUBBS II REMARK 1 TITL STRUCTURAL ASPECTS OF FACTOR XA INHIBITION 。 REMARK 999 SEQUENCE REMARK 999 1ADZ SWS P10646 1 - 111 NOT IN ATOMS LIST REMARK 999 1ADZ SWS P10646 183 - 304 NOT IN ATOMS LIST REMARK 999 THE FIRST NINE RESIDUES ARE NOT PART OF THE TFPI DOMAIN II REMARK 999 SEQUENCE BUT ARE FROM THE PFLAG PEPTIDE CLONING VECTOR. DBREF 1ADZ 1 71 SWS P10646 TFPI_HUMAN 112 182 SEQADV 1ADZ ASP 1 SWS P10646 ILE 112 ENGINEERED SEQADV 1ADZ TYR 2 SWS P10646 ILE 113 ENGINEERED SEQRES 1 71 ASP TYR LYS ASP ASP ASP ASP LYS LEU LYS PRO ASP PHE SEQRES 2 71 CYS PHE LEU GLU GLU ASP PRO GLY ILE CYS ARG GLY TYR SEQRES 3 71 ILE THR ARG TYR PHE TYR ASN ASN GLN THR LYS GLN CYS SEQRES 4 71 GLU ARG PHE LYS TYR GLY GLY CYS LEU GLY ASN MET ASN SEQRES 5 71 ASN PHE GLU THR LEU GLU GLU CYS LYS ASN ILE CYS GLU SEQRES 6 71 ASP GLY PRO ASN GLY PHE HELIX 1 1 ASP 12 PHE 15 5 4 HELIX 2 2 ASN 34 THR 36 5 3 HELIX 3 3 LEU 57 ILE 63 1 7 SHEET 1 A 2 ARG 29 ASN 33 0 SHEET 2 A 2 GLN 38 PHE 42 -1 N PHE 42 O ARG 29 CRYST1 1.000 1.000 1.000 90.00 90.00 90.00 P 1 1 ORIGX1 1.000000 0.000000 0.000000 0.00000 ORIGX2 0.000000 1.000000 0.000000 0.00000 ORIGX3 0.000000 0.000000 1.000000 0.00000 SCALE1 1.000000 0.000000 0.000000 0.00000 SCALE2 0.000000 1.000000 0.000000 0.00000 SCALE3 0.000000 0.000000 1.000000 0.00000 图 4.5 PDB文件 PDB文件 示意 NCBI * 46 显示分子结构( RasMol , ChemView ) NCBI * 47 2、 MMDB(Molecular Modeling Database) n 分子模型分子模型 MMDB 是(是( NCBI)所开)所开 发发 的生物信息数据的生物信息数据 库库 集集 成系成系 统统 Entrez的一个部分,数据的一个部分,数据 库库 的内容包括来自于的内容包括来自于 实验实验 的生物大分子的生物大分子 结结 构数据。构数据。 n 与与 PDB相比,相比, 对对 于数据于数据 库库 中的每一个生物大分子中的每一个生物大分子 结结 构,构, MMDB具有具有 许许 多附加的信息,如分子的生物学功能、多附加的信息,如分子的生物学功能、 产产 生生 功能的机制、分子的功能的机制、分子的 进进 化化 历历 史等史等 。 n 还还 提供生物大分子三提供生物大分子三 维结维结 构模型构模型 显显 示、示、 结结 构分析和构分析和 结结 构比构比 较较 工具。工具。 NCBI * 48 MMDB 实用工 具 NCBI * 49 第五节 其它生物分子数据库 n 单碱基多态性数据库单碱基多态性数据库 dbSNP n 蛋白质结构分类数据库蛋白质结构分类数据库 SCOP n 蛋白质二级结构数据库蛋白质二级结构数据库 DSSP n 蛋白质同源序列比对数据库蛋白质同源序列比对数据库 HSSP n 人类基因和遗传疾病的分类数据库人类基因和遗传疾病的分类数据库 OMIM NCBI * 50 n 真核基因启真核基因启 动动 子数据子数据 库库 EPD n 基因基因 调调 控信息的集成数据控信息的集成数据 库库 TRRD n 真核基因真核基因 顺顺 式式 调调 控元件和反式作用因子数据控元件和反式作用因子数据 库库 n TRANSFAC n 人和老鼠基因表达信息数据人和老鼠基因表达信息数据 库库 BODYMAP n 蛋白蛋白 质质 家族和家族和 结结 构域数据构域数据 库库 PROSITE n 京都基因和基因京都基因和基因 组组 百科全百科全 书书 n 生物信息数据生物信息数据 库库 的目的目 录录 数据数据 库库 DBCat n 生物学、医学文献引用数据生物学、医学文献引用数据 库库 PubMed NCBI * 51 n 核酸序列核酸序列 变变 化化 单单 碱基多碱基多 态态 性性 SNPs( Single nucleotide polymorphisms) n SNPs对对 人人 类遗传类遗传 学研究和医学学研究和医学 应应 用具有重要的意用具有重要的意 义义 无无 论对论对 于人于人 类类 种群种群 遗传遗传 学的研究,学的研究, 还还 是是 对对 疾病性状分析或个疾病性状分析或个 体化医体化医 疗疗 ,都需要深入地研究,都需要深入地研究 SNPs。 1、单碱基多态性数据库 dbSNP ( /SNP/), NCBI * 52 单倍型数据 NCBI * 53 2、蛋白质结构分类数据库 SCOP n SCOP数据库数据库 ( http:/scop.mrc-lmb.cam.ac.uk/scop/)的)的 目标是提供关于已知结构的蛋白质之间结构和进化关系的详目标是提供关于已知结构的蛋白质之间结构和进化关系的详 细描述,包括蛋白质结构数据库细描述,包括蛋白质结构数据库 PDB中的所有条目。中的所有条目。 n SCOP数据库除了提供蛋白质结构和进化关系信息外,对于每数据库除了提供蛋白质结构和进化关系信息外,对于每 一个蛋白质还包括下述信息:到一个蛋白质还包括下述信息:到 PDB的连接,序列,参考文的连接,序列,参考文 献,结构的图像等。献,结构的图像等。 n 可以按结构和进化关系对蛋白质分类,分类结果是一个具有可以按结构和进化关系对蛋白质分类,分类结果是一个具有 层次结构的树,其主要的层次是家族、超家族和折叠层次结构的树,其主要的层次是家族、超家族和折叠 : (1)家族:具有明显的进化关系家族:具有明显的进化关系 (2)超家族:具有远源进化关系,具有共同的进化源超家族:具有远源进化关系,具有共同的进化源 (3)折叠类:主要结构相似折叠类:主要结构相似 NCBI * 54 NCBI * 55 3、蛋白质二级结构数据库 DSSP n DSSP( http:/www.sander.embl-heidelberg.de/dssp/) 是一个是一个 二二 级结级结 构推构推 导导 数据数据 库库 。 对对 生物大分子数据生物大分子数据 库库 PDB中的任何一个蛋白中的任何一个蛋白 质质 ,根据其三,根据其三 维结维结 构构 推推 导导 出出 对应对应 的二的二 级结级结 构。构。 n 研研 究蛋白究蛋白 质质 序列与蛋白序列与蛋白 质质 二二 级结级结 构及空构及空 间结间结 构的关构的关 系系 n 除了二除了二 级结级结 构以外,构以外, DSSP还还 包括蛋白包括蛋白 质质 的几何特征及溶的几何特征及溶 剂剂 可及表面。可及表面。 NCBI * 56 The DSSP code H = alpha helix B = residue in isolated beta-bridge E = extended strand, participates in beta ladder G = 3-helix (3/10 helix) I = 5 helix (pi helix) T = hydrogen bonded turn S = bend 例: NCBI * 57 4、蛋白质同源序列比对数据库 HSSP n HSSP(http:/www.sander.embl-heidelberg.de/hssp/) n 二二 级级 数据数据 库库 。 n 数据来源于数据来源于 PDB,或来源于,或来源于 SWISS-PROT n 对对 于于 PDB中的每一个蛋白中的每一个蛋白 质质 , HSSP将与其同源的所有蛋白将与其同源的所有蛋白 质质 序列序列 对对 比排列起来,从而将相似序列的蛋白比排列起来,从而将相似序列的蛋白 质质 聚集成聚集成 结结 构同源的家族。构同源的家族。 n HSSP有助于分析蛋白有助于分析蛋白 质质 的保守区域,研究蛋白的保守区域,研究蛋白 质质 的的 进进 化关化关 系,有助于蛋白系,有助于蛋白 质质 的分子的分子 设计设计 。 NCBI * 58 From PDB From Swiss -prot 多重序列比对 已知结构 未知结构 NCBI * 59 5、 OMIM n OMIM (Online Mendelian Inheritance in Man),是关于人是关于人 类类 基基 因和因和 遗传遗传 疾病的分疾病的分 类类 数据数据 库库 。 该该 数据数据 库库 收集了已知的人收集了已知的人 类类 基因及由于基因及由于 这这 些基因突些基因突 变变 或者缺失或者缺失 而而 导导 致的致的 遗传遗传 疾病。疾病。 n OMIM的使用非常方便的使用非常方便 查询查询 程序根据程序根据 输输 入到入到 检检 索窗口的一个或几个索窗口的一个或几个 词执词执 行行 简单简单 的的 查询查询 ,返回含有,返回含有 该词该词 的文档的列表,用的文档的列表,用 户户 可以在列表中可以在列表中 选择选择 一个或一个或 更多的异常更多的异常 查查 看其看其 OMIM记录记录 的全文的全文 :80/entrez/query.fcgi?db=OMIM NCBI * 60 浏览染色体 NCBI * 61 6、 EPD n EPD( http:/www.epd.isb-sib.ch/ ) n 是真核基因启是真核基因启 动动 子数据子数据 库库 提供从提供从 EMBL中得到的真核基因的启中得到的真核基因的启 动动 子序列,目子序列,目 标标 是帮是帮 助助 实验实验 研究人研究人 员员 、生物信息学研究人、生物信息学研究人 员员 分析真核基因的分析真核基因的 转录转录 信号。信号。 NCBI * 62 7、 TRRD n TRRD是一个关于基因是一个关于基因 调调 控信息的集成数据控信息的集成数据 库库 , 该该 数据数据 库库 搜集真核生搜集真核生 物基因物基因 转录调转录调 控区域控区域 结结 构和功能的信息。构和功能的信息。 每一个每一个 TRRD的条目的条目 对应对应 于一个基因,包含特定基因各种于一个基因,包含特定基因各种 结结 构功能特性构功能特性 n TRRD6.0包括七个相关的数据表:包括七个相关的数据表: ( 1)基因描述表)基因描述表 TRRDGENES ( 2)控制区域表)控制区域表 TRRDLCR ( 3) 调调 控区域表控区域表 TRRDUNITS ( 4) 转录转录 因子因子 结结 合位点表合位点表 TRRDSITES ( 5) 转录转录 因子表因子表 TRRDFACTORS ( 6)表达模式表)表达模式表 TRRDEXP ( 7) 实验实验 来源表来源表 TRRDBIB NCBI * 63 8、 TRANSFAC n TRANSFAC ( http:/transfac.gbf.de/)是真核基因)是真核基因 顺顺 式式 调调 控控 元件和反式作用因子数据元件和反式作用因子数据 库库 ,数据搜集的,数据搜集的 对对 象从酵母到人象从酵母到人 类类 n TRANSFAC包括包括 6类类 数据数据 : ( 1) SITE类类 数据数据 ( 2) GENE类类 数据数据 ( 3) FACTOR类类 数据数据 ( 4) CELL类类 数据数据 ( 5) CLASS类类 数据数据 ( 6) MATRIX数据数据 NCBI * 64 9、 BODYMAP n BODYMAP (http:/bodymap.ims.u-tokyo.ac.jp/) n 是关于人和老鼠基因表达信息的数据是关于人和老鼠基因表达信息的数据 库库 ,基因表达数据来,基因表达数据来 自于不同自于不同 组织组织 、不同、不同 细细 胞以及不同胞以及不同 时时 刻。刻。 这这 里的基因表达里的基因表达 数据数据 实际实际 上是上是 3端的端的 EST。 n 通通 过过 分析分析 这这 些数据,用些数据,用 户户 可以初步掌握基因活性,了解可以初步掌握基因活性,了解 组组 织织 中中 mRNA的的 组组 成,研究基因表达成,研究基因表达 规规 律律

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论