




已阅读5页,还剩20页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
河北大学2009级本科生学年论文(课程设计)一 前言 Genbank核酸序列数据库是由美国国立生物技术信息中心(NCBI)建立和维护的。它包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它的数据直接来源于测序工作者提交的序列。EMBL数据提交方式主要有三种,即通过Webin、Sequin或 Data Submission Form三种方式提交数据,目前EMBL数据库已停止接受email格式的提交方式。日本DNA数据库DDBJ(DNA Data Bank of Japan),于1984年建立,是世界三大DNA 数据库之一。二 本论2 Genbank简介Genbank核酸序列数据库是由美国国立生物技术信息中心(NCBI)建立和维护的。它包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它的数据直接来源于测序工作者提交的序列;由测序中心提交的大量EST序列和其它测序数据;以及与其它数据机构协作交换数据而来。2.1GenBank的序列提交提交序列有两种方式,一个是在线的页面提交序列bankit,另一个是通过NCBI的Sequin软件提交序列。Sequin也是一种很好的利用了NCBI数据模型ASN.1编辑工具。BankIt 用于一条或者少数条提交的基于WWW的提交工具软件,适合于独立测序工作者提交少量序列,而不适合大量序列的提交,也不适合提交很长的序列,EST序列和GSS序列也不应用于BankIt提交。BankIt是一系列表单,包括联络信息、发布要求、引用参考信息、序列来源信息、以及序列本身的信息等。并且在提交前用 VecScreen 去除载体。1、 进入GenBank /genbank/ 点击BankIt2、在BankIt使用的时候先进行注册,点击右上角的Sign in to NCBI,在如果使第一次使用则需要注册,点击Register for an account, 如果已经创建用户名,则输入用户名、密码直接登录即可。3、登录账号后点击New Submission4、填写姓名、住址、电话、邮箱等基本信息,点击Continue5、得到序列的存取号,填写发布要求、引用参考信息、序列来源信息、以及序列本身的信息等。5.6、Sequencing Technology 测序技术如果你提交超过500个序列或者如果序列利用新一代测序技术产生此信息是必需的。选择你获取这些序列的方法7、Nucleotide界面: 选择序列合适公布日期选择是否在此提交ONLY16S核糖体RNA的数据,然后选择Molecule Type分子类型、Topology拓扑结构、Genomic completeness基因组的完整性;填写上提交序列的数目,最后是可以直接提交所有的序列或者是提交已经准备的FASTA文件。8、Set/Batch9、Submission Category提交分类说明你的序列是原始的或第三方的注释提交10、Source Modifiers来源修饰符Organelle/Location细胞器/定位11、PCR Primers (Optional) PCR引物(可选)12、Features (Overview) 特点(概述)功能的添加可以通过添加列表上传或直接输入添加,可选其中一种方式。13、Review Submission评论提交,检查完之后进行提交。如果大规模的测序如EST、 STS和GSS序列分别有专门的投递途径。ESTs:表达序列标签,短的、单次(测序)阅读的cDNA序列。也包括来自于差异显示和 RACE 实验的 cDNA 序列。GSSs:基因组调查序列,短的、单次(测序)阅读的cDNA序列,exon trap 获得的序列,cosmid/BAC/YAC 末端。HTGs:来自于大规模测序 中心的高通量基因组序列,未完成的和完成的序列。并且完成的人类的HTG序列可以同时在 GenBank 和 Human Genome Sequencing页面上访问)。STSs:序列标签位点。短的在基因组上可以被唯一操作的序列,用于产生作图位点。 SNPs:人类的和其他物种的遗传变异数据可以提交到NCBI数据库的单核苷酸多态性库中(dbSNP)。Sequin - 提交软件程序,可供Mac、PC/Windows、UNIX用户递交软件,在输入有关数据的详细资料后通过E-Mail发送到NCBI,也可以讲数据文件拷贝到软盘上邮寄给NCBI。用于一条或者很多条的提交,长序列,完整基因组,alignments,人群/种系/突变研究的提交。可以独立使用,或者用基于TCP/IP的network aware模式,可以链接到其他NCBI的资源和软件比如Entrez和PowerBLAST。同时在提交前用VecScreen去除载体。从使用方便性上来说,两者均需要填写所必须的各项资料,也都是很麻烦,但后者也以同时提交多项序列,而且不会因为网络错误而导致已填写的数据丢失,还是更有利一些。数据提交后,作者将会收到一个数据存取号,报名提交变得数据已经被接收,该存取号可作为以后向数据库查询时的凭据,NCBI也可通过BankIt 、Sequin、 E-Mail方式,对已被收入的数据进行修改、添加或删除。2.2 Genbank序列下载输入rice,单击search,得到下图注释中详细解释如果使批量下载则点击多个结果前的方框即可,如果下载一个只需要选择一个条目,选择完了之后就点击右上角的Send to,然后选择合适的格式即可。2.3 Genbank返回结果含义完整的GenBank数据库包括序列文件,索引文件以及其它有关文件。索引文件是根据数据库中作者、参考文献等子段建立的,用于数据库查询。LOCUS 代码:所有的开始于LOCUS行,图中 LOCUS名称为序列代码NR_073583 ,序列代码开始于一个英文字母,总长度不能超过10个字符,第二个字符以后可以是数字或字母,所有字符均要大写。序列长度为2531bp,生物分子的类型,是RNA,通常是DNA或RNA。最后的是数据公开日期,12-JAN-2013。DEFINITION行(也称为“DEF”行)总结记录的生物意义。ACCESSION检索号:是数据库中检索一个记录的主要关键词。所有的GenBank记录都只有一个ACCESSION行,而且一般只有一个检索号,称为主检索号码,图中为NR_073583。VERSION 版本:检索号为NR_073583,gi号为441478317。KEYWORDS 关键字:由该序列的提交者提供,包括该序列的基因产物以及其它相关信息。 SOURCE 数据来源:说明该序列是从哪儿得到的。ORGANISM 种属: 是次关键字,指出该生物体的分类学地位。REFERENCE 文献:一个序列可以有多篇文献,以不同序号表示,并给出该序列中的哪一部分与文献有关。包括AUTHORS (作者),TITLE(题目)及JOURNAL (杂志名)等,以次关键词列出。PUBMED指的是允许指向PubMed数据库以及发表者在线全文电子版的链接。FEATURES 特性表:具有特定的格式,用来详细描述序列特性。source来源 是在所有GenBank记录中出现的特性,而且特性都有一系列的限定词。特性表中带有/db-xref/标志的字符可以连接到其它数据库。ORIGIN 碱基排列顺序:全部列出,并以/作为结尾。 3 EMBL简介 欧洲分子生物学实验室EMBL,于1974年由欧洲14个国家加上亚洲的以色列共同发起建立,包括一个位于德国Heidelberg的核心实验室,及三个位于德国Hamburg,法国Grenoble及英国Hinxton的研究分部。由于具有开放和创新的良好学术氛围,EMBL已发展成欧洲最重要和最核心的分子生物学基础研究和教育培训机构。 EMBL-DNA数据库于1982年由EMBL建立,与美国的GenBank及日本的DDBJ共同组成全球性的国际DNA数据库,近年来发展很快,在1995年数据量成倍递增。EBI是EMBL在英国Hinxton的分部,主要负责建立EMBL-DNA数据库,可进行核苷酸序列检索及序列相似性查询。3.1 EMBL的序列提交EMBL数据提交方式主要有三种,即通过Webin、Sequin或 Data Submission Form三种方式提交数据,目前EMBL数据库已停止接受email格式的提交方式。直接提交的数据要经过EMBL数据库专家的复核,但其信息准确度和质量的高低最终还是由提交者负责。进入EMBL:http:/www.ebi.ac.uk/embl/先进行注册,点击Register填写信息之后点击Save选择提交序列的类型选择发布日期填写引用的信息直接提交的数据要经过EMBL数据库专家的复核,但其信息准确度和质量的高低最终还是由提交者负责,提交的信息除包括提交者个人资料外,还应包括物质的全部生物学特征,如各种描述性信息及源信息、种属来源、分子型、细胞株、细胞型、基因序列、相关产物、参考文献资料、特征信息(如codingregions,regulatory signals等)等等3.2 EMBL的序列下载例如输入AB000888;点击右上角的Download,然后选择下载的格式即可。3.3 EMBL返回结果含义输入序列号 AB000888,选择EMBL formatID是序列名称,为序列的标识符行,包括登录号、类型、分子的长度,图中AB000888为登录号,SV为序列版本行,图中指的是该序列数据是第1个版本。序列名称是mRNA,长度为937bp。XX为分隔行号。DT为创建和更新日期;第一行为创建日期,第二行为更新日期。DE为序列描述行。KW为关键字。图中为磷脂酸磷酸酶2A。OS为描述生物的种属。 OC描述生物体分类信息。 RN相关文献编号或递交序列的注册信息。RP参考文献的其他注释。RA参考文献作者或递交序列的作者。RT参考文献的题目。RL参考文献杂志名或递交序列的作者单位RX行是其他文献数据库的连接,如“PUBMED;9305923”表示对应参考文献在PUBMED数据库的标号是9305923,RA相关文献作者或递交序列的作者DR是到其他生物信息数据库的链接,如到基因组数据库,蛋白质数据库等FH为特征表开始符号FT为特征表行,FT行具体的信息有:序列的长度、序列来自何种生物体、何种组织,在染色体上的定位,蛋白质编码序列片段在整个序列中的位置,外显子和内含子的位置,与基因对应的蛋白质序列等。FT行主要有三项(1)Feature Key,它是描述特征的关键字,如source,CDS等(2)Location,指明特征在序列中的特定位置,(3)Qualifirs,描述关于一个特征的辅助信息。SQ碱基种类统计数。A:240 C:218 G:209 T:2704 DDBJ简介日本DNA数据库DDBJ(DNA Data Bank of Japan),于1984年建立,是世界三大DNA 数据库之一,与NCBI的GenBank,EBI的EMBL数据库共同组成国际DNA数据库,每日都交换更新数据和信息,并主持两个国际年会国际DNA数据库咨询会议和国际DNA数据 库协作会议,互相交换信息,因此三个库的数据实际上是相同的。DDBJ数据库是国际上最具权威的)DNA序列数据库之一,其所发布的核酸序列信息在生物信息科学研究中起着相当重要的作用。它集数据收集、检索、分析功能于一体,为用户提供了多方位的服务,并且数据的检索方式灵活多样,可根据用户的层次差异和不同需求,提供由浅到深、由简到繁等多种检索途径。该数据库的检索方法较易掌握,但如何分析和利用所检得的数据结果需要较深的生物信息学专业知识背景。4.1 DDBJ的序列提交进入DDBJ http:/www.ddbj.nig.ac.jp/searches-e.html点击Data Submission,我们又两种数据提交的方式,我们可以选择第一种,点击进去之后,在点击最下面的Start new submission可以出现多种数据提交的网站,点击Create new submission该途径数据提交可用日文或英文两种文字,用户可按软件提供的模板格式(start from template)提交数据,也可从Start进行标准格式提交。该途径首先要求用户提供联系人的Email地址,输入电子邮件地址后数据库马上给用户提供一个记录号,用于标记将要提交的数据信息,接着用户需提供联系人的姓名及确切联系地址,这些信息填好后即生成一个有关前述信息的记录,用户可以马上上传数据内容也可日后追加(SAKURA页面的Resume), 数据内容包括参考信息、序列信息及生物体信息等。参考信息要求提供来信信息的出版状况包括准备中(In Preparation)、submitted for publication(投寄中)、在版(In press)、已出版(Published)、只在本数据库出版(Published only in Database)等选项)、刊名、年、卷、页码及作者姓名等内容。序列信息要求提供序列的长度、序列内容等,其中序列数据可直接复制或粘贴到该页面进行提交,但在数据量很大无法粘贴时也可通过Upload将装载有关数据的文件直接上载。生物体信息要求提供分子类型、生物体名称、细胞系、细胞类型、染色体等37项内容。该途径数据提交格式较规范,为DDBJ推荐使用的途径。4.2 DDBJ序列下载输入rice进行快速搜,结果如下:选择想要下载的结果,点击结果前面的方框即可,如果是想要批量下载,则多选几个结果即可,最后再选择下载的格式点击Download即可。4.3 DDBJ返回结果Geten
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 黄石市英语六年级小升初期末复习试题
- 2025年电信5G协优资格认证考试题库附含答案
- 散水施工方案
- 2025年烟草面试试题及答案
- 淮南铁艺廊架施工方案
- 物理试题卷(解析版)【湖北卷】【高二下期末考】湖北省孝感市部分高中2024-2025学年下学期高二年级7月期末联考(7.1-7.2)
- 2025年鸡舍正压过滤(FAPP)通风设备项目立项申请报告
- 方形楼梯扶手施工方案
- 妇科健康咨询方案模板
- 污水厂截流井施工方案
- 主观幸福感量表SWB
- DB42-T 2300.4-2024 农业生态产品生产技术规范 第4部分:水产类
- 2024年4月自考00634广告策划试题
- 沪教版九年级上册化学第三章《物质构成的奥秘》检测卷(含答案解析)
- 如何与客户建立有效的沟通
- 薯片加工项目规划设计方案
- 部编版小学数学六年级上册分数乘法应用题解法一:找单位“1”解析同步练习
- 职业教育课题申报:产教融合背景下职业院校“四位一体”校企合作模式研究与实践
- 效益工资发放审批表
- 土壤的环境背景值与容量
- GB/T 26399-2011电力系统安全稳定控制技术导则
评论
0/150
提交评论