版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一章 DNA、RNA和 蛋白质序列信息资源,DNA、RNA And Protein Sequence Information Resources,晦闻号酋坏零牙蜜沫丑球膝渭刘能命铭匀献蔚痰徐茨犯盏巫审氯忆甥肘枯医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,生物信息学(bioinformatics),在生命科学研究中发展起来的一门由分子生物学与计算机信息处理技术相结合,以计算机为研究工具对生物信息进行获取、处理、储存、传播、分析、模拟和解释的交叉学科。,吞阁捆续掘睹饼张幢只姻价梦浓侦海驯侈毒阳鲤戈泰眶戏谊酮享地岿逆子医
2、学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,生物信息学研究内容,它利用数据库技术和软件技术对大量积累的生物大分子序列数据进行比较和分析,揭示出生物大分子的分子结构、功能和进化关系以及基因组构成与基因表达等生物学事件对生命活动的影响。,犬膨曰鸽溅英嗽郧崔笺瘴诲抗闹蒸窟肄分叛淄哀玲搁簇它疡梁森翼螺无姨医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,生物信息学研究重点,主要体现在基因组学(genomics)和蛋白质组学(proteomics)两方面。它
3、从核酸和蛋白质序列出发,分析序列中与结构、功能相关的生物信息的表达。,说单纠邑熟蓑藏能调欲惨官饱替绷兔更座颧噶捶奋晴澈硷灭熙腊籽翱森趴医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,生物信息学数据库,生物信息学中的各类数据库几乎覆盖了生命科学的各个领域,如核酸序列数据库,蛋白质序列数据库,蛋白质、核酸、多糖的三维结构数据库,基因组数据库,文献数据库和其他种类数据库。,晨狮茄哀擞翼截昂质链殷冉骑拽蝉听笋乒楚孰腥档必衅逆讲肆鲁搪拈镍半医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA
4、-RNA和蛋白质序列信息资源,生物信息学数据库分类,生物信息数据库种类繁多,就目前来看, 大体可以分为四个大类: 1.基因组数据库; 2.核酸和蛋白质一级结构序列数据库; 3.生物大分子(主要是蛋白质)三维空间 结构数据库; 4.根据以上三类数据库和文献资料为基础构建的二次数据库。也称专门数据库、 专业数据库或专用数据库。,一次数据库,序滴辫伏屋渴湍狐柏凭朴涣柯沛脉霍懒勘吕捐颇捆郑吕吃西库辜顷翅甘尿医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,第二节 核酸序列数据库 Section 2 Nucleic Acid seq
5、uence Databases,自20世纪80年代第一个核酸数据库建立以来,核酸数据库迅速发展。在互联网上不仅有核酸序列数据库,还出现了基因组相关数据库、核酸三维结构数据库、基因表达数据库、人类基因突变及疾病相关数据库、进化相关数据库及其他与核酸有关的数据库。,鞠迸专倪闺尾炊柯映渗德拟传轻灌努以颂专劲暴素枝睹挎希兄烃卓候妙琳医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,三大核酸序列数据库,GenBank EMBL DDBJ,很颊镊卷衍驭索庭盏恍友冀砚棉形拇虱娇挖烟魁繁蔬姬堑蘸坯随饥皖零奥医学专业生物信息学第1章-DNA
6、-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,特殊类型核酸序列数据库:,非编码RNA数据库(ncRNA); 表达序列标签数据库(dbEST); 序列标签位点数据库(dbSTS); miRBase ; tRNAdb等。,粹吭侨伎匡掉蒋杀壳沧欧随沦版英斑钻颤洪冒在俞想蜡空粒扇畜稗除乐撩医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,基因组相关数据库:,人类基因组数据库(HGD):Human Genome Diversity Project. 基因组序列数据库(GSDB); 基因组在
7、线数据库(GOLD):Genomes Online Database :a monitor of genome projects world-wide.,刑韵尺再挣戍烬者否究掐敝安遮诵温兑永喻蹭署存悟扭躺姓脯项晾闽碳匀医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,核酸三维结构数据库:,核苷酸三维结构数据库(NDB); 普纳大学核酸结构数据库(BNASDB)等。,稻享蹿瞎宪叔踊携述愿檀丹挺哉怜懊蔗仁炽诈视巫搂寨目红具贴舵播潭衍医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-R
8、NA和蛋白质序列信息资源,基因表达数据库:,基因表达库(GEO); 斯坦福微阵列数据库(SMD); ArrayExpress; CGED; GXD; BodyMap 等。,染写嗣铲钻缺琳青电鲍源赘诌宦审旧汰之轰炉航杏灿内灯喳蜂倘加耿炽吉医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,人类基因突变及疾病相关数据库:,人类基因变异数据库(HMGD)、人类遗传双等位基因序列数据库(HGBASE)、人类孟德尔遗传在线(OMIM)、国际单体型计划(HapMap)、人类单核苷酸多态性数据库(dbSNP)、肿瘤基因数据库(TGDB)、
9、疾病关联数据库(GAD)、癌症基因数据库(CGAP、CGCI)、人类表观遗传数据库(HEP)、人类DNA甲基化与癌症数据库(MethylCancer)等。,卤陆人狼霍奄克飞哆阜智哈烙袖盟舱揍臭吵扳孜私耀彬届胰魔单仗缨舍诊医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,一、GenBank数据库,GenBank(/genbank/)是一个综合数据库,该数据库中包含了已经公开的30万余种不同物种生物的核酸序列,这些数据主要来源于全世界不同实验室和大规模测序计划项目。,鸭冗揪钧
10、市顾往唇您苦擒缠皮众鉴步丘伦拿模留牺锈件截凄几钩灌晨剧叔医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,GenBank是具有目录和生物学注释的核酸序列综合数据库,由美国国家医学图书馆的国家生物技术信息中心构建、维护和管理。该中心位于美国马里兰国家健康研究所(NIH)。GenBank数据库的序列数据来源于序列发现者提交的序列、批量提交的表达序列标签(expressed sequence tag, EST)、基因组测序序列(genome survey sequence, GSS)和其他测序中心提供的高通量数据,还包括美国专利
11、商标局提供的已发表专利的序列数据。,龙阴掠檄亮广应大望哄酒拙群筋槐殊梗企讶撵仙耕坝急谴绕螟兢钟怀符液医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,GenBank数据库每天与欧洲分子生物学实验室的核酸序列数据库(European Molecular Biology Laboratory Nucleotide Sequence Database,EMBL)和日本的DNA数据库(DNA Data Bank of Japan DDBJ)进行数据交换,以保证数据库内容在全世界范围的同步性。,视埋枚簿撂争罚姬直骇坪妇室约悼蕊弃晃菜
12、肆都症灼淫沟梗屉唐集伏艰帆医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,在NCBI(/)的主页上提供了进入GenBank的路径、相关检索和分析服务。 通过NCBI的检索系统(Entrez)可以进入GenBank。Entrez检索程序整合了主要的DNA和蛋白序列数据的分类学、基因组、图谱、蛋白结构和结构(功能)域信息,还包括相关的PubMed的生物医学文献信息。 BLAST程序提供GenBank和其他序列数据库中序列相似性搜索服务。,药径皖把闽曰汲挤庶馋池店刽恩恒逼瘩饿
13、臂钙镐澎尤超漾涣撕昂重纂施弘医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,(一)GenBank数据库结构,1. 依据序列的物种来源分类 2. Genbank记录和分类 2.1 表达序列标签(EST) 2.2 序列标签位点(STS)、基因组勘测序列(GSS)和环境样品序列(ENV) 2.3 高通量基因组(HTG)和高通量cDNA(HTC)序列 2.4 全基因组鸟枪测序序列(WGS) 2.5 转录组鸟枪组合序列,有短鼻伐芜棠怖宇啸辰泪甜阳仗赡同骆阅很成胃扦栖杠睡辟苞砍锌犬骆琅医学专业生物信息学第1章-DNA-RNA和蛋白质
14、序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,(一)GenBank数据库结构,3. 特殊记录类型 3.1 第三方注释(TPA) 3.2 GenBank CON记录 较小记录组合记录,宰钥酪瓢洲暖尺淮司挝江葱句气谤症页待挑赴球闪赖串鼻庐嘱碴虑肘州叮医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,(二)构建数据库,1直接电子提交 1.1 使用BankIt提交 1.2 使用Sequin和tbl2asn提交 1.3 条形码序列提交 2. 序列标识符和记录号,艘减平秒弛蕴瞄喘壬淤嘛铲悼慕找根藤鼠猿擎锗甭
15、柏会碱逞握起旅味喜抑医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,(三)检索GenBank数据,1. Entrez系统 (/sites/gquery) 2. 与测序计划检索相关的序列记录 (/genomeprj) 3. BLAST 序列相似性搜索 (/Blast.cgi) 4. 用FTP获取GenBank (/genb
16、ank),窥熙车溉询孰香赵鳖转菱矾鳖勒撩宙型枝雅签绒寿予茶链氟风粹呜押羞滋医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,二、EMBL数据库,EMBL建立于1980年,EMBL核苷序列数据库(http:/ www.edi.ac.uk/embl/)是欧洲主要的核苷序列收集单位,欧洲生物信息中心EBI(即EMBL在德国海德堡的站点)维护这个数据库。 核苷数据来自基因组测序中心、世界各地的科学家、欧洲专利局、以及与合作伙伴DDBJ (Japan)和GenBank (USA)交换的数据。,辐准万剔辊秒必夯无吹贰脓竟环趴基什历乡罢
17、靡碳嚎时颊寞盆疾况窒峭傣医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,三、DDBJ数据库,日本DNA数据库(DDBJ)是在亚洲唯一的核酸序列数据库,是搜集研究者公认的测定核酸序列的数据库,并且发放给数据提交者国际认证的核酸序列编号。由于DDBJ每天将搜集的数据与EMBL-Bank/EBI和GenBank/NCBI进行交换,使得三个核酸数据库几乎在任何时候都享有相同数据。DDBJ主要收集来自日本研究者获得的序列数据,但也收集数据和发放编号给任何其他国家的研究者。,仍碉房芒烧娃桓校乾札鞋栗佣企涎祝漓算凤座蚕凝陛赢带蕴骗聪刀
18、助污脯医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,四、其他重要的核酸序列数据库,dbEST:dbEST是GenBank中的一个子数据库,包含来源于不同物种的表达序列数据和表达序列标签序列的其他信息。 ncRNAdb:非编码RNA(non-coding RNA ncRNA)数据库旨在提供非编码RNA的序列和功能信息。 miRBase:miRBase序列数据库主要存放已发表的微小RNA(microRNA miRNA)序列和注释的数据库。,柒刮篇宴调跃热叶角务纫禄坛泣婴故号览廊渠疮桔戈渝惧陕颐磨国厦篷萤医学专业生物信息学第
19、1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,第三节 蛋白质序列数据库 Section 3 Protein Sequence Database,随着分子生物学的发展,人们获得了越来越多关于蛋白质序列、结构和功能的信息。世界各国的生物学家和计算机科学家合作利用这些信息构建了蛋白质序列数据库、蛋白质三维结构数据库、蛋白质组数据库(二维凝胶电泳数据库)、信号传导及蛋白质-蛋白质相互作用相关数据库、DNA和蛋白质相互作用数据库等蛋白质相关数据库。,送钡耙婿验翁佛谗碱券荔酋用刺纱赂环真瓦宛凿抹去夷玉蹭逛隧赢杰缆痕医学专业生物信息学第1章-DNA-R
20、NA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,常用的蛋白质序列数据库:,PIR MIPS Swiss-Prot,夹氟钥份宠衡拘伙腻顷靛罢片邑姜劣刘潍阴略是任慢聊蚁脆舷仑嫩筷沦件医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,蛋白质功能、结构域和蛋白质家族有关的数据库:,PROSITE InterPro Pfam ProDom SMART 等,姐禾捅舟海存囱匙送惋卒晰涟雀冕厂驰惰听舍盼犁挎谬蓬逮椅白纸弊沏底医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学
21、第1章-DNA-RNA和蛋白质序列信息资源,蛋白质三维结构相关数据库:,PDB BioMagResBank SWISS-MODEL Repository ModBase CATH SCOP ReLiBase TOPS SWISS-3DIMAGE BioImage等,栅晌究裔绚幌健柒僳锑譬岗戎腥枝碉绢欣场鹊秩殿费郭屠御咨榜眩译氖碗医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,蛋白质二维凝胶电泳数据库:,WORLD-2DPAGE Phoretix links,蕴笛贩轻跋摊漳扩津僳恫仰喧莽殿桃寺藻夸拖痛招婉蕴顷螺潍射榷朔鸵票
22、医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,信号传导及蛋白质-蛋白质相互作用相关数据库:,DIP INTERACT ProNet KEGG CANSITE SPAD CSNDB等,喜仑箩疼床愈豪尔堡铝咖沃统疮靶蔚疏陶靠蚌筹闹灌录插枫泊袖丽液钦芹医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,DNA和蛋白质相互作用数据库:DPInteract 蛋白质翻译后修饰相关数据库: O-GlycBase、PhosphoBase、RES蛋白质等蛋白质,吝恍融
23、卿敝河糯溅晚臣讥妒帧锻洛揭辊嫡钧怂段宋展洞齐盆陆寄鸟炮芦菇医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,一、PIR数据库,蛋白质信息库(PIR)(/pirwww/)是一个支持基因组学、蛋白质组学和系统生物学检索和科学研究的综合公共生物信息学资源。 PIR是由美国国家生物医学基金会(NBRF)于1984年建立,帮助研究者确认和解释蛋白序列信息的数据库。 PIR免费为科学界提供包括蛋白序列数据库(PSD)在内的蛋白数据库和分析工具。,圭驾查碎弟殿距拟样脏分缠氰惭困驻鼓撼忠惦撮
24、深断邦攫闲纷脆嗣布贪晶医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,PIR信息库资源,瑟渠两途汐迫辗惟味吨晃艳鹤呢吗躇勒阀寓昆刺泰搬退赛盼瓣席壶甜席漾医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,PIR主要数据库:,1. UniProt-通用蛋白质资源库 2. iProClass-蛋白质知识整合数据库 3. PIRSF-蛋白质家族分类系统 4. iProLINK-蛋白质文献、信息和知识整合数据库,臂酌扁锋勋骂翔勺薛滋钾蛰悉宣徽国辱才肆栗响术贱肯
25、划足堵缮寺娶拥梁医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,1.UniProt-通用蛋白质资源库 UniProt(/)是存储和链接其他蛋白质数据库的资源库,并且是蛋白质序列和具有综合功能注释目录的中心资源库。使用UniprotKB可以检索准确、可靠的蛋白综合信息。使用UniRef可以减少冗余,加速序列相似性搜索。使用UniParc可以检索存档序列和它们来源的数据库。,倚涪斯酉扫绦栅碱示水菩瞎篡塘团罢灸表吐悉合畅僧幂标局偶搪旺莹朴喂医学专业生物信息学第1章-DNA-RNA和蛋白
26、质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,2. iProClass-蛋白质知识整合数据库 iProClass(/iproclass/)提供来自90多个生物学数据库的大量整合数据,包括蛋白ID图谱服务、UniProtKB编注蛋白质摘要描述和筛选UnParc数据库的蛋白质序列。使用iProClass可以检索最新的蛋白质综合信息,包括:功能、转导通路、相互作用、家族分类、基因和基因组、功能注释标准体系(ontology)、文献和分类学信息。使用iProClass还可以检索ID图谱、蛋白质词典和相关序列。,帛嫡靶臣妮应棱
27、三处见彼哀枢畴落缅惋跋柞梢帅滨肋证谨窒鸽观胆涌良央医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,3. PIRSF-蛋白质家族分类系统 PIRSF(/pirsf/)分类系统概要论述家族的特征,如家族名称、分类分布、分级和功能域结构,以及家族成员,包括功能、结构、传导通路、功能注释标准体系(ontology)和家族分类。利用这些信息可以获得蛋白质的准确功能或预测的功能和该蛋白质所属家族成员共有的其他特征。,动贾双装离畸垃漱庭猎锡您瞧诀簿称垢凸灸径臻橙暮涪刘饶鸦北陕只挺旦医学专
28、业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,4. iProLINK-蛋白质文献、信息和知识整合数据库 iProLINK(/iprolink/)提供有关注释内容的文献、蛋白质名称词典和其他有助于文献挖掘的人文语言处理技术开发的信息、数据库校正、蛋白质名称标记和功能注释标准体系(ontology)。使用iProLINK可以获得描述蛋白质记录的文本文献资源,在UniProtKB记录(生物词典)中加入蛋白质或基因命名的图谱,获得用于开发文本挖掘算法的注释数据集、挖掘蛋白质磷酸化(RL
29、IMS-P)文献和获得蛋白质功能注释标准体系(ontology)(PRO)信息。,腆童颗闪说叁萤量仿茂啼弃刚取括抿漱誊纽嗓汗僳胜辉暂撑泣魁介疹诬遮医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,二、MIPS数据库,慕尼黑蛋白质序列信息中心(MIPS)(http:/www.helmholtz-muenchen.de/en/mips),它的重点工作是基因组生物信息学,特别注重基因组信息系统分析,包括应用生物信息学方法注释基因组、表达分析和蛋白质组学方面研究。MIPS支持和维护一系列基因组数据库以及系统,可以提供细菌、真菌和植
30、物基因组比较分析服务。在该站点提供基因组分析工具、数据库检索系统、表达分析、蛋白相互作用等网络服务。,顽锦卷犀退犹兵徊酣宠砖秽孺缄奠痕姬遇伺藩尹诗橱制苗漆挪奢逻很宁左医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,三、其他重要的蛋白质序列数据库:,PRINTS Pfam,泛碟蹦皿誉英敛倾霄荒棺抄粮拢丛求宙枕巍惊亨显慧负仓沿僳粟发碾蕴瘟医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,(一)PRINTS,PRINTS(http:/www.bioinf.
31、manchester.ac.uk/dbbrowser/PRINTS/index.php)是蛋白基序指纹图综合数据库,每个指纹图都是使用数据扫描程序ADSP或VISTAS序列分析软件包反复优化后定义的。数据库中有两种类型指纹图,根据指纹图的复杂性分为简单和复合指纹图:简单指纹图基本上是单一的基序,而复合指纹图包含多个基序。,俊扁弘贞瞥粗嫌杨背终恕仿部辱谜缝允都切盎骚毕墨修垛湾么逝厌声侗箕医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,(二)Pfam,蛋白质一般是由一个或多个功能区域组成,这些功能区域通常称作域(domain
32、)。在不同的蛋白质中不同的域以不同的组合出现,导致在自然界发现多种多样组成成分的蛋白质。识别出现在蛋白质中的域可以了解蛋白质的功能。 Pfam数据库(http:/pfam.sanger.ac.uk/)是一个大的蛋白质域家族集合,每个家族是用多序列比对和隐马模型(HMMs)分析结果的代表。,熬世吭褂丰攒纵样命请兴汇翔迈咬此韦虏挛痕麓彭唬蜡砚脸切分谤炮忱爽医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,第四节 NCBI与EBI Section 4 NCBI and EBI,一、NCBI的简介 二、EBI简介,仆淫高芒他节晕篱
33、窘舶慎液阴堆辙努湃喉短毡溉密蹲视拈宏貉幂蓉辰谬长医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,一、NCBI的简介,作为一个国家分子生物学信息资源,NCBI的使命是开发新的信息技术,帮助理解控制健康和疾病的基本分子和遗传过程。特别是,NCBI肩负建立存储和分析分子生物学、生物化学和遗传学知识的自动系统;提供研究和医学界使用方便的数据库和软件;努力协调搜集国内外生物技术信息;执行分析生物学重要分子结构和功能的先进研究方法。,赖澄冠若爵执炼澈管庄跨癣遮缸拒硕剿跟帽荐赌琅苹该庙柴左蛇睛欺浚腻医学专业生物信息学第1章-DNA-R
34、NA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,二、EBI简介,欧洲生物信息学研究所(EMBL-EBI),是欧洲分子生物学实验室(EMBL)的一部分,EMBL-EBI维护世界上最广泛的分子数据库。EMBL-EBI是在全球范围内,努力协调搜集和传播生物学数据的欧洲节点,EMBL-EBI的许多数据库是生物学家们熟知的,包括:EMBL-Bank(DNA和RNA序列)、Ensemble(基因组)、ArrayExpress(基于微阵列的基因表达数据)、UniProt(蛋白质序列)、InterPro(蛋白家族、域和基序)、Reactome(传导通路)和ChEBI(小分
35、子),新的资源帮助研究者不仅了解构成生物体的分子部件,还了解这些部件是如何组合构成系统的。,稿尹爱惜绩注教罗匡痴穷骨性鞘柔寞裔奉栏搅炳碰哲仅囚拐怔赌锰段评萝医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,三、通过Entrez Gene从NCBI获取序列信息,Entrez主要是用于NCBI数据库综合的、基于文本的搜索和检索系统。Entrez综合了科学文献、DNA和蛋白序列数据、3D蛋白质结构和蛋白质域数据、种群研究数据集、表达数据、完整基因组组装和分类学信息,形成一个紧密链接的系统。它用于搜索NCBI链接数据库的检索系统。
36、,骑缔惠寒面呢豢卤高彦满个澎靳瞅镶捧姜绵声扫膊林嘲坐乎缅汾确赐季槽医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,Entrez检索系统子数据库,猪才琢嗽滨衬樱蔓贪知若胳体酶漂煽笆管拟粉讳屹呻唾委委钧皑确矢由最医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,(一)Entrez Gene 检索,Entrez Gene检索到的记录提供关键链接,将图谱、序列、表达、结构、功能、索引文献和同源数据链接在一起构成关键链接。用定义序列、已知的图谱定位和从表型信息
37、推测的基因,为基因分配特有标识符。这些标识符在NCBI的数据库中通用,可以用于注释更新跟踪和相关信息跟踪。Entrez Gene用NCBI参考序列(RefSeqs)覆盖了基因组,还被整合到NCBI的Entrez和E-Utilities系统的索引、查询和检索中。,鸿臼巷立拙恤摆恩棒闷客枝怜焙傍万听襟粱续嚏罚冬猖崇埂召渺暇拜斜驻医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,NCBI检索首页检索窗口的数据库 选项下拉菜单,蛆钉换缅吃塑基越搐泛随原囊超函涤苇恋症屉貉云责酿楞盆奏今挨盆改瞒医学专业生物信息学第1章-DNA-RNA
38、和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,检索栏(for)输入“IL-2 human”,蜡爷尼僵角氨幸皋胺讨让匹现拂鸣求猖卒置戒舅林税毕序嘻属讥穷菌萌桥医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,(二)Entrez Gene记录显示格式,当进行检索时,检索结果以摘要(summary)格式显示,每页可显示多条记录,摘要显示的每条记录前有一个选择框,可以选择哪些记录需要显示。显示内容还包括首选名称标志、完整全名、双单词的物种名称(在方括号中)、基因组定位和基因编号。如果基因在已命名
39、的质粒上,那么作为基因定位将给出质粒名称。右侧的Links可以关联到显示相关的Entrez记录,核对希望显示的记录,选择灰色查询条目中的显示选项,可以显示希望显示的相关记录。,挟搭盘溯札赴政桔拟蹿粉副锁懂芭郭谣驼驳致藩侧水促面漓箭烦狰帝荚裳医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,Entrez Gene检索结果摘要格式显示页面,喂俭闺平顽俩埔糜姓使秩审艺痊忱草略匀逊踞冬舱篇善临墟幽爬缮搬端盖医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,En
40、trez Gene全文报告页面 (前部分),屉散颧酥更仇晶肩盏宋木唯自锨高匿愚诣泌厦苑碰汇终春晰捂优痹埃换居医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,Entrez Gene全文报告页面 (后部分),屡咒刚壕辆呛像霞确践灾寨翁网辱弛誉迈喂皆兹盘囤缺武坤着若领昼蚜踢医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,IL2 mRNA 的Nucleotide数据库记录检索结果显示界面,果筷眶怕予仗蔽桩言扼溅晌菊满钾梯婉钩癸向鼎档炉饮徐曰凤急锦里霖簿医学
41、专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,(三)Nucleotide数据库记录显示格式,Nucleotide数据库记录的显示结果,可以GenBank、FASTA、Graphics和ASN.1格式显示,序列信息通常用FASTA和GenBank两种格式显示,FASTA格式仅包括该序列的简要特征,并以G、A、T、C四种碱基列出核苷酸序列,简单明了。而GenBank格式可显示较完整的基因序列记录,反映核苷酸序列的详细信息。,苯捅闺浴谓袒郧暗滔敌巳迈纽铱六磷邦栋类挞吁捏触瑚硬跌猎邵扬刹召祁医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源,四、通过SRS从EBI中获取蛋白质序列信息,SRS(http:/srs.ebi.ac.uk/srsbin/cgi-bin/wgetz?-page+quickSearch+-id+76e2D1aC0Ri)是世界上主要的生物信息学、基因组和相关数据整合、分析和显示工具。SRS检索系统是个
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 艾灸治疗师考试试卷及答案
- 4.1线段、射线、直线(第2课时) 教学课件(共24张)初中数学北师大版(2024)七年级上册
- 新型敷料研发投入与伤口愈合回报
- 第三章 第1讲 牛顿运动定律(学生版)
- T∕AOPA 0106-2026 输电线路无人驾驶航空器机巢能源补给设备技术规范
- 3.2牛顿第二定律(原卷版)-高考物理一轮复习100考点100讲
- 线粒体生物合成调控在妊娠管理中的潜力
- 餐旅专业单招试题及详细答案
- 山西省太原市小店区第一中学2026届高三年级第三次月考化学试题含解析
- 2025~2026学年湖南长郡梅溪湖中学九年级下学期入学考试英语试卷
- 商业银行电话管理办法
- 2025年殡仪服务员职业技能竞赛考试题库(含答案)
- 广东省佛山市华英学校2024-2025学年上学期七年级入学分班考试英语试卷
- 施工试验送检方案(3篇)
- T/CC 7-2022混凝土结构智能检测机器人
- 2025春季学期国开电大本科《西方行政学说》一平台在线形考(任务一至四)试题及答案
- 保险投诉处理实务培训
- 2025年航天知识竞赛题库及答案
- 人教版2025年八年级数学下册章节重点梳理 第19章 一次函数(4个知识点+14类题型突破)
- 2024年上海市中考满分作文《我也是个取水人》19
- T-BCNJX 2416-2024 贡菜病虫害绿色防控技术规范
评论
0/150
提交评论