




已阅读5页,还剩107页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
NCBI数据库检索,National Center of Biotechnology Information,NCBI简介, NCBI就是美国国家生物技术信息中心(National Center of Biotechnology Information) NLM是美国国家医学图书馆(National Library of Medicine) NIH是美国国立卫生研究院 (National Institutes of Health),NCBI中通过Entrez可互查的数据库,NCBI数据库,Nucleotide:DNA序列数据库 Protein:蛋白质序列数据库 Genome:基因组序列数据库 Structure:分子结构模型数据库 Popset:种群、种系发生或突变序列数据库 Taxonomy:微生物类别数据库 OMIM:人类孟德尔遗传学在线数据库。,一. Nucleotide(GenBank),该数据库由国际核苷酸序列数据库成员美国国立卫生研究院GenBank、日本DNA数据库(DDBJ)和英国Hinxton Hall的欧洲分子生物学实验室数据库(EMBL)三部分数据组成。,二 . Genome,即基因组数据库,提供了多种基因组、完全染色体、临近序列图谱以及一体化基因物理图谱。,三. Structures,即结构数据库或称分子模型数据库(MMDB),包含来自X线晶体学和三维结构的实验数据。MMDB的数据从PDB(Protein Data Bank)获得。,四. Taxonomy,即生物学门类数据库,可以按生物学门类进行检索或浏览其核苷酸序列、蛋白质序列、结构等。,五. PopSet,包含研究一个人群、一个种系发生或描述人群变化的一组组联合序列。PopSet既包含核酸序列数据又包含蛋白质序列数据。,六. OMIM,孟德尔遗传学(OMIM)数据库是人类基因和基因疾病的目录数据库。该数据库包括原文信息、图片和参考信息,同时还可以链接到Entrez系统MEDLINE数据库中相关文献和序列信息。,PubMed数据库检索,一、PubMed数据库简介,PubMed是美国国家医学图书馆(NLM)下属的国家生物技术信息中心(NCBI)开发的、基于WWW的医学数据库查询系统。 PubMed的网址: /pubmed /entrez/query.fcgi,PubMed,数据类型:期刊论文、综述、以及与其他数据资源链接。 特点: 1.免费提供题录和文摘 2.可与提供原文的网址链接 (部分免费获取) 3. 操作简便、快捷,期刊来源地理分布,北美 (31%),欧洲和中东 (52%),非洲 (1%),中南美洲 (2%),ASIAN, Australia (14%),MEDLINE 2919 独有,BIOSIS 3071,2043 shared,BIOSIS 与 MEDLINE的覆盖范围,MEDLINE:联机医学文献分析和检索系统,BIOSIS (Biosciences Information Service, 美国生物科学信息服务社),4,400 Employees,11,500 Employees,2,800 Employees,9,900 Employees,Intl Legal & Regulatory,North American Legal,Scientific,Financial,Tax & Accounting,Healthcare,2,600 Employees,3,100 Employees,2005 营业收入 87亿美元 为全球2千万用户提供服务 市值260亿美元,福布斯全球500强之一,二、通过PubMed可检索 到如下的信息,MEDLINE PreMedline 出版商提供的书目信息,MEDLINE,MEDLINE:是美国国立医学图书馆MEDLARS系统中最大的生物医学数据库,收录1966年以来70多个国家近4300种生物医学期刊的书目信息和著者文摘,每周更新。每条记录均带有PubMed-Indexed for MEDLINE标志。,PreMedline:收集未正式给予MeSH词、出版类型等深度标引信息的一个临时库。NLM每天把最新记录加入到PreMedline库中,每条记录均带有PubMed-in Process标志。工作人员在一周内将这些记录标引,然后转入MEDLINE,同时从PreMedline中删去。,PreMedline,Pre-Medline,Medline,New Data,Collect,PubMed,Process,PubMed,出版商提供的书目信息:出版商提供的是整本期刊的信息,若有部分没有被MEDLINE收录,PubMed仍保存,在记录中做PubMed-as supplied by publisher的标记。,图1,以下是几条PubMed的记录,标记不同,其出自的分库也不同,三、PubMed文献检索,PubMed页面的结构,PubMed Central页面的结构,三、PubMed页面的结构,执行检索,基本检索输入框,三、PubMed页面的结构,执行检索,基本检索输入框,Related Resources : MeSH Database-主题词数据库 Journal Database-杂志数据库 Clinical Trials-对公众提供临床科研的当前信息 PubMed Tools: Citation Matcher-引文匹配器 在表格输入刊物的引文信息来定位特定文章。 Clinical Queries-与临床相关的疗法,诊断,病因,预后咨询。,1、词语检索及自动词语匹配,四、PubMed的基本检索功能,四、PubMed的基本检索功能(二),2、作者姓名检索 在检索框内按照姓+名缩写(不用标点)的格式键入作者姓名,如Liu C,系统会自动在作者字段内进行检索。 如果想进行更精确的检索,可以用双引号将作者名引起来,再加au,如“Liu C”au,四、PubMed的基本检索功能(三),3、杂志名检索 在检索框中键入杂志全名molecular biology of the cell 也可以直接键入Medline的期刊标准缩写形式,如:mol boil cell, 键入刊物的ISSN(国际标准出版物代码)进行检索,如1059-1524。 Cell transplantation ta,四、PubMed的基本检索功能(四),4、截词检索 可利用系统的截词功能获取更多的相关文献,截词符“*”可代表多个字符,将*加在检索词后可以表示对所有以该词开头的词进行检索;如:bacter*,可以检出bacter, bacteria, bacterium, bacteriophage等词。,四、PubMed的基本检索功能(五),5、短语检索 PubMed首先将键入的检索词(词组)视为合理的短语在短语索引中进行查找。如: single cell ,PubMed将其视为词组进行查找。当PubMed没有找到该词组时,系统将自动把两个词分开进行检索; 如果不希望系统将两词分开,则需要用“”把检索词括起来,即强迫PubMed进行词组检索。如“single cell”。 当用双引号括起词语时,PubMed将不执行自动词语匹配功能。,五、显示检索结果(Display):,text1,Summary作者姓名、文章题目、出处、记录状态、 语种、出版物类型、PMID。,Abstract出处、记录状态、文章题目、作者姓名、 作者单位、文摘、出版物类型、缩写、注释、PMID等。,六、检索结果的保存 1,六、检索结果的保存 2,文章数目,链接(Links) 链接外部资源LinkOut LinkOut 是链接到本站点外部信息的出口。可以与出版商、信息集成者、图书馆、生物学数据库、序列中心等链接来获取更多的相关信息。 链接带星号的LinkOut 是表明提供者需要订阅、会员资格或需要交费进入。 链接相关图书Books 为帮助用户解决对检索结果中不熟悉的要领提供背景资料,七、检索结果的链接(Links),文摘中的期刊图标链接,Linkout链接,GenBank数据库检索,三大基因数据库,Genbank Genbank库包含了所有已知的核酸序列和蛋白质序列。它是由美国国立生物技术信息中心(NCBI)建立和维护的。 NCBI的网址是:。 EMBL核酸序列数据库 由欧洲生物信息学研究所(EBI)维护的核酸序列数据构成。 数据库网址是:http:/www.ebi.ac.uk/embl/。 DDBJ数据库 日本DNA数据仓库(DDBJ)也是一个全面的核酸序列数据库。 DDBJ的网址是:http:/www.ddbj.nig.ac.jp/。,GenBank,Public free Available via Internet,EMBL Data Library,DDBJ (DNA Data Bank of Japan),三大基因数据库之间的关系,在线获取序列( entrez)方法1,1.进入entrez,2.选择数据库,3.查询关键词,4.开始查询,显示格式,每页显示数目,符合条件的记录数,mRNA数量,不同物种记录数,在线获取序列方法 2,显示格式,符合条件的记录数,mRNA数量,不同物种记录数,在线获取序列 方法3,Accession number,序列长度,数据类型,Definition: 标题,GI number,物种名称,基因名称,编码蛋白名称,GenBank数据格式,该序列发表在哪篇论文中,基因序列提交Genbank 方法 1 在线提交,基因序列提交Genbank 方法 2 Sequin软件提交,共克隆、测序了北京油鸡风味特性基因43个,五指山小型猪3个,虎源犬瘟热病毒基因4个,提交GenBank 50个。,举例:序列数据的查询,某天,Prof. Gene发现人的Hela细胞中,有丝分裂期间有异常情况:细胞不再分裂,而是开始凋亡(表型,phenotype),通过实验的方法,发现了与有丝分裂期间某个蛋白可能相互作用的一个基因,测序结果如下(genotype):,CCCCTGCCTGGCAGCCCTTTCTCAAGGACCACCGCATCTCTACATTCAAGAACTGGCCCTTCTTGGAGGGCTGCGCCTGCACCCCGGAGCGGATGGCCGAGGCTGGCTTCATCCACTGCCCCACTGAGAACGAGCCAGACTTGGCCCAGTGTTTCTTCTGCTTCAAGGAGCTGGAAGGCTGGGAGCCAGATGACGACCCCATAGAGGAACATAAAAAGCATTCGTCCGGTTGCGCTTTCCTTTCTGTCAAGAAGCAGTTTGAAGAATTAACCCTTGGTGAATTTTTGAAACTGGACAGAGAAAGAGCCAAGAACAAAATTGCAAAGGAAACCAACAATAAGAAGAAAGAATTTGAGGAAACTGCGGAGAAAGTGCGCCGTGCCATCGAGCAGCTGGCTGCCATGGATTGAGGCCTCTGGC,正常细胞,凋亡细胞,问 题:,1. 这是哪个基因? 2. 编码的蛋白质序列是怎样的? 3. 有没有保守的功能结构域(domain)? 4. 它的功能是怎样的? 5. 有没有三级结构信息?,NCBI: BLAST,/,nucleotide blast,Megablast: 找基因序列,输入序列,提交序列,NM_001168.2:Survivin,Geo: 基因表达信息,Gene info:基因信息,Survivin,Gene info: 17号染色体,功能注释:Gene Ontology,结论1,1. 该基因为人的Survivin基因,染色体定位:17号染色体,73721872-73733311;基因标识符:NM_001168.2; 2. 初步的功能分析:细胞周期,caspase酶的抑制因子,等等。,NM_001168.2:Survivin,Human Survivin!,获取蛋白质的序列信息,Survivin:142aa,结 论2,人的Survivin蛋白质包含142个氨基酸,序列标识符为:NP_001159.2,获取FASTA序列,FASTA格式的序列,PHI-BLAST: find domain,填入蛋白质的FASTA序列,BIR domain,结 论3,Survivin具有保守的功能结构域BIR,如何进行Survivin功能分析。如:亚细胞定位,活性中心位点,3D结构。,/,UniProt: 蛋白质数据库,在人中做BLAST搜索,Survivin:O15392,Survivin的蛋白质信息,功能注释,结论4:功能分析,1. 在瘤形成过程中可能起一定作用; 2. 阻碍G2/M期的细胞编程性凋亡; 3. Chromosomal passenger complex (CPC)的成员之一。 细胞亚定位:胞质,核。,PDB:三级结构数据库,Survivin的三级结构信息,Raswin: 三级结构显示,Raswin: 三级结构显示,总 结,1. 该基因为人的S
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030年中国高效燃油燃烧添加剂市场分析及竞争策略研究报告
- 2025至2030年中国镭射热转印膜市场分析及竞争策略研究报告
- 2025至2030年中国计测仪表市场分析及竞争策略研究报告
- 2025至2030年中国粗纹棉麻油画布市场分析及竞争策略研究报告
- 2025至2030年中国牵引轴承座市场分析及竞争策略研究报告
- 2025至2030年中国流量检测仪器市场分析及竞争策略研究报告
- 2025至2030年中国橡塑印章市场分析及竞争策略研究报告
- 2025至2030年中国无氧紫铜棒市场分析及竞争策略研究报告
- 2025至2030年中国扁脚电源线市场分析及竞争策略研究报告
- 2025至2030年中国崩解剂市场分析及竞争策略研究报告
- 2024年马鞍山含山县招聘高中教师笔试真题
- 高中数学第九、十章统计与概率章节测试卷-2024-2025学年高一下学期数学人教A版(2019)必修第二册
- 【真题】五年级下学期数学期末试卷(含解析)四川省成都市高新技术产业开发区2023-2024学年
- 种植质量安全管理制度
- 2025至2030中国大型发电机行业发展趋势分析与未来投资战略咨询研究报告
- 中国歌剧舞剧院管理制度
- 2025年炉外精炼工职业技能理论知识考试题库(含答案)
- 外墙真石漆修补方案(3篇)
- 道路养管协议书
- 2025年河北省专技人员公需课《人工智能时代的机遇与挑战-预训练大模型与生成式AI》答案
- 静脉治疗个案汇报
评论
0/150
提交评论