已阅读5页,还剩92页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,生物分子数据库的查询,.,数据库查询是指对序列、结构及各种二次数据库中的注释信息进行关键词匹配查找,有时也称为数据库检索。如对SWISS-PORT输入关键词insulin,即可查找该数据库所有胰岛素或与胰岛素油光的序列条目。,.,一、Entrez系统二、SRS系统三、其它查询方式四、GenBank的查询,.,Entrez是基于Web界面的综合生物信息数据库检索系统。利用Entrez系统可以方便地检索核酸数据、蛋白质序列数据、基因组图谱数据、三维结构数据、种群序列数据集及文献数据。,一、Entrez系统,/sites/gquery?itool=toolbar,.,.,.,选择数据库,查询关键词,.,获取批量序列(BatchEntrez),Entrez提供了批量获取GenBank序列的功能(BatchEntrez),/sites/batchentrez?,.,选择文件,文件内容,GI号或者accessionnumbers的列表,开始获取序列,.,.,使用十分方便,Entrez的特点,.,.,把数据库和应用程序结合一起,.,.,对文献摘要的关键字查询时,考虑实际匹配和意义相近匹配,.,.,SRS(SequenceRetrievalSystem)是EMBL研制的一个基于WEB的查询系统。SRS包括EMBL、EMBL-NEW、Swiss-Prot、PIR等一级数据库,还包括许多二级数据库,Prosite、ReBase、EPD、ECD、ENZYME等,与功能、疾病相关的数据库。http:/genius.embnet.dkfz-heidelberg.de/menu/srs/,二、SRS系统,.,国际上主要SRS数据库查询系统$U1y&G%r5H,.,数据库选择页面,查询结果管理页面,标准查询方式页面,查询过程存储页面,显示管理页面,系统安装的数据库清单,.,展开所有数据库,选取数据库,快速查找,标准查找,扩展查找,.,设定更多限定的标准查找,.,扩展查找,.,更为精确的扩展查找,.,SRS的特点,1.统一的Web用户界面只需安装Netscape等网络浏览器即可通过Internet查询世界各地SRS服务器上的300多个数据库。2.高效的查询功能SRS系统采用了建立数据库索引文件的手段,能快速、高效地对各种数据库进行查询。,.,3.灵活的指针链接许多生物信息数据库包含与其它相关数据库的代码,SRS根据查询结果产生链接指针,既节省了存储空间,也便于数据库管理。4.方便的程序接口将序列分析等常用程序整合到基本查询系统中,用户可以对查询结果直接进行进一步分析处理。,.,5.开放的管理模式用户可在本地机上安装自己的SRS系统,将自己的数据库添加到SRS系统中,并可与其它数据库实现超文本链接。也可自行编写应用程序,整合到SRS系统。,.,三、其它查询工具,DBGET,KEGG,DBGET/LinkDB检索工具(http:/www.genome.ad.jp),.,.,.,.,Retrieve服务器(R)Query服务器(),.,四、GenBank数据库检索及其应用Entrez查询,.,简介,GenBank数据库是由美国国立生物技术信息中心(NCBI)维护的一级核酸序列数据库。,GenBank数据库的数据来源有三种:1、直接来源于测序工作者提交的序列;2、与其它数据机构协作交换的数据;3、美国专利局提供的专利数据。,.,GenBank和PubMed(序列数据)检索的比较:,1、GenBank的检索结果是序列及其注释信息,PubMed的检索结果是与序列数据相关的文献信息。2、GenBank数据更新早于PubMed,GenBank数据库的检全率高于PubMed。3、GenBank可对序列数据进行限制检索,而PubMed只能对文献、杂志、作者等进行限制检索,因而GenBank数据库的检准率也高于PubMed。,.,检索界面,.,基本检索输入框,基本检索界面:,.,执行检索按钮,基本检索输入框,rasGENE,.,跨库检索界面:,rasGENE,执行检索按钮,.,.,GenBank数据库界面:,/genbank/,.,核苷酸序列数据库检索界面:,特征栏提供辅助检索功能,.,基本检索功能,(一)名称、作者姓名等检索,(二)特殊标志符检索,(五)范围检索,(三)序列长度检索,(四)分子重量检索,.,基本检索功能,(一)名称、作者姓名等检索,1、基因名称的检索限定词:GENE2、生物体名称的检索限定词:ORGN3、作者姓名的检索限定词:AUTH,.,.,基本检索功能,(二)特殊标志符检索,.,特殊标志符的格式(核酸序列):,2、GenBank/EMBL/DDBJ序列接受号:(1)1个字母+5个阿拉伯数字e.g.:U12345(2)2个字母+6个阿拉伯数字e.g.:AY123456,Af123456,1、序列辨认号(GI):一串阿拉伯数字e.g.:6995995,.,(1)mRNA记录(NM_*):e.g.:NM_000492(2)基因组DNA重叠群(NT_*):e.g.:NT_000347(3)完整的基因组或染色体(NC_*):e.g.:NC_000907(4)基因组的局部区域(NG_*):e.g.:NG_000019(5)从人类基因组序列注释、加工得到的序列模型记录(XM,XP,orXR_*):e.g.:XM_000483,3、RefSeq(ReferenceSequence)序列接受号:,.,4、PDB序列接受号:个阿拉伯数字个字母e.g.:TUP,序列接受号的检索限定词为ACCNorACCESSION,.,AF123456ACCN,.,.,基本检索功能,(三)序列长度检索,序列长度的检索限定词:SLEN,.,1510SLEN,.,.,基本检索功能,(四)分子重量检索,分子重量的检索限定词:MOLWT,.,2009MOLWT,.,.,基本检索功能,(五)范围检索,.,范围检索:中间用冒号连接,1、序列接受号范围检索:AF114696:AF114714ACCN2、序列长度范围检索:3000:4000SLEN3、分子重量范围检索:2002:2009MOLWT4、日期范围检索:2005/01:2006/09/26MDATorPDAT,.,特征栏辅助检索,限制检索(Limits),高级检索(Advance),.,限制检索,高级检索,.,特征栏辅助检索,限制检索(Limits),.,限制检索范围,限制检索(Limits):,.,限制检索范围,ras,.,.,排除某种类型的序列,.,限制分子类型,.,限制分子类型,.,限制基因位点,.,限制基因位点,.,限制序列片段的显示,.,限制序列片段的显示,.,限制数据来源,.,限制数据来源,.,限制数据修订日期,.,限制数据修订日期,.,.,特征栏辅助检索,限制检
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年化工包装安全创新报告
- 私人二手房屋买卖协议书
- 《遗传学》课件-第九章 遗传病的诊断
- 2026年福建省莆田市第二十四中学高三4月份模拟考试化学试题含解析
- 肾移植术后人巨细胞病毒与多瘤病毒感染的多维度解析与应对策略
- 肾安提取液对糖尿病肾病小鼠模型的干预效应与分子机制解析
- 辽宁省沈阳二中、抚顺二中2026届高三3月测试(线上)化学试题含解析
- 肺肉瘤样癌10例临床特征、治疗及预后的深度剖析
- 护理健康管理师:营养与膳食指导
- VR元宇宙开发协议(2026年前沿版)
- 成都高投集团招聘笔试题
- 限额以下小型工程常见安全隐患指导手册(2026版)
- 年龄相关性黄斑变性课件
- 银行AI算力云平台建设-第1篇
- 码头防污染培训课件
- 维修安全教育培训内容课件
- 学校实验室安全工作档案制度
- 2025至2030中国商用车用摄像头和监视器更换后视镜行业调研及市场前景预测评估报告
- 2025年地下管网智能监测系统建设项目可行性研究报告及总结分析
- 流产后关爱流程
- 雨课堂在线学堂《新闻摄影》单元考核测试答案
评论
0/150
提交评论