




已阅读5页,还剩65页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
NCBI分子生物学数据库应用简介 佳木斯大学基础医学院生物教研室朱金玲2009 3 NCBI NationalCenterofBiotechnologyInformation 简称NCBI 美国国立生物技术信息中心 NCBI是NIH NationalInstitutesofHealth 美国国立卫生研究院 的NLM NationalLibraryofMedicine 美国国立医学图书馆的一个分支 NCBI简介 http www ncbi nlm nih gov 美国国立医学图书馆 NLM 于1988年11月4日建立国家生物技术信息中心 NCBI NCBI的主要任务是 为储存和分析分子生物学 生物化学和遗传学知识创建自动化系统 从事研究基于计算机的信息处理过程的高级方法 用于分析生物学上重要分子和化合物的结构和功能 促进生物技术研究者和医药治疗人员应用数据库和软件 努力协作以获取世界范围内的生物技术信息 NCBI主要任务 主页网址http www ncbi nlm nih gov NCBI简介 NCBI首先创建GenBank数据库 在重点开发GenBank的同时 又于1991年开发了Entrez数据库检索系统 该系统整合了GenBank EMBL PIR和SWISS PROT等数据库的序列信息以及MEDLINE有关序列的文献信息 并通过相关链接 将他们有机地结合在一起 NCBI还提供了其它数据库 包括在线人类孟德尔遗传 OMIM 三维蛋白结构的分子模型数据库 MMDB 人类基因序列集成 UniGene 生物门类 Toxonomy 等等数据库 数值型 工具型 看主页 一 Entrez系统AllDatabases Entrez系统 AllDatabase 是NCBI建立的基于Internet网生物医学数据库的集成检索系统 搜索引擎 涉及核酸序列 蛋白序列 大分子结构 基因组图 基础医学及临床医学等内容数据库 包括Nucleotide Protein Genome Structure OMIM PopSet Taxonomy以及PubMed在内的35个数据库 使用方法是选择好检索词输入到for后面的框里 按go就可以了 例1 以presenilin1为搜索词 作业 自己选一个搜索词回去试一试 http www ncbi nlm nih gov sites gquery主页 Entrez系统现已改为AllDatabases新的Entrez检索界面为用户检索这些数据库提供了很大的方便 因其最大的特色在于所有的数据库可在同一个检索界面进行检索 其结果之间建有超级链接 可直接进行交互访问使用 通过相关链接 Entrez将这些数据库有机地结合在一起 可以进行序列 结构 生物分类及文献数据的相关交叉检索 注意 AllDatabases在NCBI主页 的搜索框中 输入presenilin1 搜索的结果是一致的 一 Nucteotide 核苷酸序列数据库 收集了多个来源核酸序列的数据库 包括来自美国GenBank 英国EMBL 欧洲分子生物实验室 DDBJ 日本 RefSeq 参考序列数据库 的序列 每日NCBI的工作人员将世界各地实验室提交的核酸序列数据以及与国际其他核酸数据库等交换获得的核酸序列数据加入到数据库中 其数据量呈指数增长 二 数据库资源 所有已知的核苷酸序列与之相关的生物学信息参考文献 用accessionnumber 作者姓名 物种 基因 蛋白名字 还有许多其他的文本术语来查询 例如 用基因 蛋白名字查找IL6 IL6 NG011640 页面右侧 dian1 dian2 下拉 1 dian3 2 二 Genome 基因组数据库 包括各种基因组 全部染色体 序列图及集成的遗传与物理图谱 可通过该数据库浏览人类全部基因组序列数据的图像 该数据库1990年初建于美国霍普金斯大学 是一个专门汇集存储人类基因组数据的数据库 其中包括了全球范围内致力于人类DNA结构和100 000种人类基因序列研究的分析成果 对从事相关领域的研究人员具有重要的参考作用 目前 该库包括以下多种内容 人类基因组 包括基因 克隆 断裂点 细胞遗传标记物 易断位点 重复片段等 人类基因组示意图 包括细胞遗传图关联图 辐射杂交图 综合图等 人类基因组内的变异 包括基因突变和基因多态性 还有等位基因发生频次等数据资料 该数据库为文理中心和北京大学生命科学学院国家蛋白质重点实验室联合引进 在北京大学图书馆设立了镜像服务器 面对CALIS所有成员馆免费开放 用户免付国际网通讯费 数据库网址 主页 IL6 点主页真核细胞进入此页 三 Protein 蛋白序列数据库 该数据库的蛋白质序列数据包括来自GenBank EMBL DU BJ数据库的DNA序列的翻译编码产物 以及向PIR 蛋白信息资源 SWISS PROT 蛋白质序列注释知识数据库 PRF 蛋白研究基金数据库 PDB 蛋白数据库 等数据库提交的蛋白序列数据 基因mapview 向下找 15显示结果 四 EST 表达序列标签数据库 expressedsequencetags 表达序列标签是指从不同组织来源的cDNA文库中随机挑选的克隆进行5 或3 端测序后得到的部分cDNA序列 长度一般为200 500bp表达序列标签 EST 在基因组作图 克隆基因 新基因的识别 蛋白质组研究等许多方面具有重要的用途 2003年第14卷第01期 题目 表达序列标签及其应用作者 陈红歌 贾新成 本文介绍了EST的制备方法 以及构建均一化cDNA文库的方法 并介绍了EST在以上各方面的应用 五 GSS 是Genebank的一个分之 与EST相似 六 Structure 结构数据库 结构数据库或分子模型数据库 MMDB 包括了来自PDB ProteinDataBank 数据库的由晶体衍射和核磁共振实验研究得到的大分子三维结构的信息 由于Entrez系统的所有数据库间的交叉链接 由此用户可以很方便地从网上浏览大分子的平面图像或三维立体图像 Cn3D4 1 七 PopSet 种群组数据库 该数据库收录来自种群研究 种系发生研究或突变研究的数据 包括核酸和蛋白质序列数据库 八 OMIM 人类孟德尔遗传数据库 该数据库收集了人类基因与遗传疾病的各种信息 包括原文 图片和参考信息 同事还可以链接到Entre系统的Medline数据库中相关文献和序列信息 此库为动态 作业以Down ssyndrome为例检索 点1 九 Taxonomy 生物分类数据库 该数据库收录了在NCBI数据库中出现的所有生物的核酸序列或蛋白序列 可按生物学门类进行检索活浏览 十 SNP 单核苷酸多态数据库 基因组变异最常见的一种形式是单核苷酸多态性 singlenucleotidepolymorphism SNP 其应用范围较微卫星标记更加宽广 它对群体遗传学 制药业 法医学 癌症及遗传性疾病甚至进化的研究都将产生不可估量的影响 国际上较重要的网站有 1 dbSNP http www ncbi nlm nih gov SNP 该网站是由美国的NCBI主办的 它除了可接受各地发来的SNP申请注册外 也向公众免费提供对SNP的查询 2 hGBASE http hgbase interactiva de 该网站建在德国 收集基因内SNP 研究者可通过检测出的序列查询SNP 3 mITSNP数据库 http www genome wi mit edu SNP human index html 该网站是由美国麻省理工学院建立的 它包括数千条已经定位的SNP 可以通过指定染色体的某一区域查询SNP 其它的SNP站点还有 华盛顿大学 网址是 http www ibc wustl edu SNP CHLC 网址是 http www chlc org cgap nature genetics snps html 美国人类基因组研究所 网址是 http www nhgri nih gov About nHGRI Der variat htm 十一 UniSTS 表达序列标签数据库 十二 EST 表达序列标签数据库 EST ExpressedSequenceTag 表达序列标签 定义 STS 序列标签位点 SequenceTaggedSites STS 数据库 dbSTS 是GenBank的分库 e PCR工具是UniSTS资源库的一部分 可用来寻找一段目的DNA片断中的STS标记物 标记物资料包括引物序列 产物大小 作图信息和别名 dbSTS是 NCBI 一种新的数据库 主要收录基因标志序列或序列标志位点和图谱数据 虽然dbSTS序列将并入GenBank 但是dbSTS中的注释更具综合性 包括有关实验者 实验条件和基因图谱定位等更为详细的信息 dbEST GenBank EMBL DDBJ PDB中EST部分的无冗余数据 dbSTS GenBank EMBL DDBJ PDB中STS部分的无冗余数据 十三 PubMed medline 十四 PMC 注意 三 检索方法 一 联合检索方法在Entrez主页提供的检索框中输入一个或多个检索词 点击 Go 即可开始对所有数据库同时进行检索 检索结果直接出现在结果显示界面所有数据库名称的左侧 点击任一项结果都可进入相应数据库的显示界面 数据库名称右侧之后的 可链接该数据库的简短注释 下图中显示apoptosis在各数据库中的检索记录数 点击后可链接相应数据库中的记录显示 Entrez AllDatabase PubMed Apoptosis 十五 Books 十六 Journals Structure Apoptosis CrystalStructureOfCaspase 7 CrystalStructureOfProcaspase 7 Limit 限制功能用来缩小检索范围 除去不需要的部分 可提高文献查准率 Nucleotide与Protein数据库提供了下述限制内容 1 字段限制 AllFields 可将检索范围限制在某一字段 如著者 基因名称 生物体 序列长度及篇名词等 共有22项字段限制内容 2 选择排除某些种类的序列 如排除ESTs 表达序列标签 GSS 基因组调查序列 patents 专利序列 等 需要排除时勾选相应内容左侧之选框 3 限制特殊的分子类型 Molecule 包括基因组DNA RNA mRNA rRNA Nucleotide Limit 现没有 Protein Limit 4 限制某一子库 OnlyFrom 可选择的子库有RefSeq NCBI的参考序列计划 GenBank DDBJ EMBL等 5 限制在特殊的基因位点 GeneLocation 可选择基因组有DNA RNA 线粒体 叶绿体 6 限制序列修改 或出版 的日期 ModificationDate 可根据需要填清起止的时间 4 其他功能 同PubMed相似 在检索界面可以使用Cubby Linkout等功能 另外 在结果显示页还可通过 Link 链接RelatedSequences PubMed Taxonomy及Linkout等其他数据库 以获得更多的信息 Protein数据库中提供的 Blink BLASTLink 链接为Entrez所有蛋白序列在
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025江苏苏州市张家港市人力资源开发有限公司招聘宣传专员1人模拟试卷及答案详解(名师系列)
- 2025安徽池州市贵池区招聘教师24人考前自测高频考点模拟试题附答案详解(完整版)
- 2025内蒙古鄂尔多斯市中心医院引进高层次人才97人考前自测高频考点模拟试题及答案详解1套
- 2025江苏泰州市卫生健康委员会所属部分事业单位招聘专业技术人员9人考前自测高频考点模拟试题带答案详解
- 堤防工程设计与施工技术方案
- 污水处理厂设备更新项目施工方案
- 室外道路照明智能化改造方案
- 建设工程项目质量考核与评估方案
- 现代农业发展示范项目建设工程方案
- 中心城区雨污分流改造项目建筑工程方案
- 微信工作群规定管理制度
- 甲亢疾病案例分享会
- 2025年高校教师资格证之高等教育学通关题库(附答案)
- 人类简史面试题目及答案
- T/SHBX 007-2023单向拉伸聚乙烯包装膜
- 电子版实习协议书
- 无人机公司人力资源管理方案
- 新华社 校招 笔试题目及答案
- 2025pvsyst v8中文版PVsyst SA小时数据模拟
- 第十二讲民族危亡与民族意识觉醒(1840-1919)-中华民族共同体概论专家大讲堂课件
- 消防风机房管理制度
评论
0/150
提交评论