版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
演示文稿教你使用数据库现在是1页\一共有61页\编辑于星期五(优选)教你使用数据库现在是2页\一共有61页\编辑于星期五生物信息学第三讲:序列的采集、存储和查询
现在是3页\一共有61页\编辑于星期五本章内容提要1.DNA测序2.序列数据的存储3.序列数据的文件格式4.序列数据的查询现在是4页\一共有61页\编辑于星期五1.DNA测序1.
DNA一次测序的长度为500bp。2.基因组的测序方案:将大的染色体打断成100kbp的片断,插入到BAC(BacterialArtificialChromosome)中。再随机打断,克隆,然后再组装成长的序列(contig)。3.EST(Expressedsequencetag)测序:细胞中mRNA反转录成cDNA,方向不定,测序。4.UniGene:为每一个基因创造一个唯一的条目,收集这个基因所有的ESTs.5.GSS(基因组测序序列):类似于ESTs,来源基因组。6.HTG(高通量基因组序列):高通量、尚未完工的DNA序列。现在是5页\一共有61页\编辑于星期五基因组测序:两种方案1.DNA片段在染色体上的位置、方向已知。首先染色体被打断成150kbp左右的片段,然后克隆到BACs中,再进一步打碎,克隆,测序,组装。2.“鸟枪法”,shotgun,随机将DNA片段打碎,克隆,测序,组装。DNA片段在染色体上的位置和方向未知。现在是6页\一共有61页\编辑于星期五现在是7页\一共有61页\编辑于星期五2.序列数据的存储1.核酸三大数据库:GenBank,EBI,DDBJ.2.Ensembl数据库:基因组注释。3.ESTs数据库;4.UniGene数据库5.Refseq数据库;6.NCBI的Gene信息数据库;7.蛋白质序列:Swissprot/TrEMBL/UniProt数据库。现在是8页\一共有61页\编辑于星期五三大数据库之间的联系现在是9页\一共有61页\编辑于星期五GenBank中测序最多的20个物种161.0版,2007.08现在是10页\一共有61页\编辑于星期五dbEST:表达序列标签数据库2007.08,总序列45,660,524条,最多的20个物种如下现在是11页\一共有61页\编辑于星期五UniGene:AnOrganizedViewoftheTranscriptom现在是12页\一共有61页\编辑于星期五Refseq数据库1.提供高质量的,无冗余的,完整的序列信息;2.包括基因组的DNA,转录成的RNA以及蛋白质序列信息。3.序列文件的标识符:DNA/RNA序列,NM_XXXXXX;蛋白质序列:NP_XXXXXX现在是13页\一共有61页\编辑于星期五现在是14页\一共有61页\编辑于星期五NCBIGene1.2.序列从Refseq数据库中得到;3.详尽的注释信息,包括基因在基因组的定位,基因名称、蛋白质名称,基因结构,等等。现在是15页\一共有61页\编辑于星期五UniProt1.专家审核的蛋白质序列数据与知识库;2.UniProtKnowledgebase:Release12.1,2007.083.包括:Swiss-ProtRelease54.1of21-Aug-2007:277883entries;TrEMBLRelease37.1of21-Aug-2007:4754787entries现在是16页\一共有61页\编辑于星期五Swiss-ProtRelease54.1现在是17页\一共有61页\编辑于星期五TrEMBLRelease37.1现在是18页\一共有61页\编辑于星期五3.序列数据的文件格式1.DNA/RNA/氨基酸代码的标识2.GenBank数据格式3.UniProt4.FASTA现在是19页\一共有61页\编辑于星期五GenBank数据格式Definition:标题序列长度数据类型Accessionnumber版本号GInumber现在是20页\一共有61页\编辑于星期五GenBank的数据类型现在是21页\一共有61页\编辑于星期五UniProt数据格式Accessionnumber现在是22页\一共有61页\编辑于星期五FASTA格式现在是23页\一共有61页\编辑于星期五4.序列数据的查询某天,Prof.Gene发现人的Hela细胞中,有丝分裂期间有异常情况:细胞不再分裂,而是开始凋亡(表型,phenotype),通过实验的方法(例如,酵母双杂交),发现了与有丝分裂期间某个蛋白可能相互作用的一个基因,测序结果如下(genotype):CCCCTGCCTGGCAGCCCTTTCTCAAGGACCACCGCATCTCTACATTCAAGAACTGGCCCTTCTTGGAGGGCTGCGCCTGCACCCCGGAGCGGATGGCCGAGGCTGGCTTCATCCACTGCCCCACTGAGAACGAGCCAGACTTGGCCCAGTGTTTCTTCTGCTTCAAGGAGCTGGAAGGCTGGGAGCCAGATGACGACCCCATAGAGGAACATAAAAAGCATTCGTCCGGTTGCGCTTTCCTTTCTGTCAAGAAGCAGTTTGAAGAATTAACCCTTGGTGAATTTTTGAAACTGGACAGAGAAAGAGCCAAGAACAAAATTGCAAAGGAAACCAACAATAAGAAGAAAGAATTTGAGGAAACTGCGGAGAAAGTGCGCCGTGCCATCGAGCAGCTGGCTGCCATGGATTGAGGCCTCTGGC现在是24页\一共有61页\编辑于星期五问题:1.这是哪个基因?2.编码的蛋白质序列是怎样的?3.有没有保守的功能结构域(domain)?4.它的功能是怎样的?5.它在真核生物中保守吗?6.有没有三级结构信息?现在是25页\一共有61页\编辑于星期五NCBI:BLAST现在是26页\一共有61页\编辑于星期五nucleotideblast现在是27页\一共有61页\编辑于星期五Megablast:找基因序列输入序列现在是28页\一共有61页\编辑于星期五提交序列现在是29页\一共有61页\编辑于星期五NM_001168.2:SurvivinUniGeneGeo:基因表达信息Geneinfo:基因信息现在是30页\一共有61页\编辑于星期五Survivin现在是31页\一共有61页\编辑于星期五Geneinfo:17号染色体现在是32页\一共有61页\编辑于星期五功能注释:GeneOntology现在是33页\一共有61页\编辑于星期五结论11.该基因为人的Survivin基因,染色体定位:17号染色体,73721872-73733311;基因标识符:NM_001168.2;2.初步的功能分析:细胞周期,caspase酶的抑制因子,等等。现在是34页\一共有61页\编辑于星期五NM_001168.2:Survivin现在是35页\一共有61页\编辑于星期五HumanSurvivin!现在是36页\一共有61页\编辑于星期五获取蛋白质的序列信息现在是37页\一共有61页\编辑于星期五Survivin:142aa现在是38页\一共有61页\编辑于星期五结论2人的Survivin蛋白质包含142个氨基酸,序列标识符为:NP_001159.2现在是39页\一共有61页\编辑于星期五获取FASTA序列现在是40页\一共有61页\编辑于星期五FASTA格式的序列现在是41页\一共有61页\编辑于星期五PHI-BLAST:finddomain现在是42页\一共有61页\编辑于星期五填入蛋白质的FASTA序列现在是43页\一共有61页\编辑于星期五BIRdomain现在是44页\一共有61页\编辑于星期五结论3Survivin具有保守的功能结构域BIR现在是45页\一共有61页\编辑于星期五UniProt:蛋白质数据库现在是46页\一共有61页\编辑于星期五在人中做BLAST搜索现在是47页\一共有61页\编辑于星期五Survivin:O15392现在是48页\一共有61页\编辑于星期五Survivin的蛋白质信息现在是49页\一共有61页\编辑于星期五功能注释现在是50页\一共有61页\编辑于星期五结论4:功能分析1.在瘤形成过程中可能起一定作用;2.阻碍G2/M期的细胞编程性凋亡;3.Chromosomalpassengercomplex(CPC)的成员之一。…细胞亚定位:胞质,核。现在是51页\一共有61页\编辑于星期五人的Survivin在酵母中有同源物吗?现在是52页\一共有61页\编辑于星期五提交序列现在是53页\一共有61页\编辑于星期五在酵母中进行序列比对现在是54页\一共有61页\编辑于星期五酵母BIR1:P47134现在是55页\一共有61页\编辑于星期五酵母BIR1的信息现在是56页\一共有61页\编辑于星期五结论5:人的Survivin在酵母中的同源物可能是BIR1。现在是57页\一共有61页\编辑于星期五PDB:三级结构数据库现在是58页\一共有61页\编辑于星期五Survivin的三级结构信息现在是59页\一共有61页\编辑于星期五Raswin:三级结构显示现在是60页\一共有61页\编辑于星期五总结现在,Prof.Gene知道了:1.该基因为人的Survivin基因,染色体定位:17号染色体,73721872-73733311;基因标识符:NM_001168.2;2.人的Survivin蛋白质包含142个氨基酸,序列标识符为:NP_001159.23.Survivin
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026广东阳江市阳春市招聘公益性岗位7人(第七批)笔试备考试题及答案解析
- 2026福建医科大学附属医院招聘41人笔试模拟试题及答案解析
- 2026广西北海市自然资源生态修复中心招聘临聘人员1人(截至3月23日)考试备考题库及答案解析
- 2026年合肥滨纷公寓慕庭招聘笔试参考题库及答案解析
- 2026年新疆兵团第五师双河市总医院高层次人才引进(5人)笔试备考试题及答案解析
- 2026枣庄市财金控股集团有限公司招聘5人笔试备考题库及答案解析
- 2026年合肥滨纷公寓慕庭招聘笔试备考题库及答案解析
- 2026辽宁营口市卫生健康事务中心招聘3人笔试备考试题及答案解析
- 2026内蒙古包头市英思特稀磁新材料股份有限公司招聘21人考试备考题库及答案解析
- 2026河南省科学院新型显示技术研究所招聘2人笔试模拟试题及答案解析
- 2026年安徽财贸职业学院单招职业技能测试题库附答案详解
- 2025小红书医美行业精准获客与营销增长白皮书
- 介绍嘻哈饶舌说唱
- GB 46750-2025民用无人驾驶航空器系统运行识别规范
- 焊工考试题库及焊工证模拟考试100题含答案
- 2025江西华赣航空产业投资集团有限公司招聘工作人员16人笔试历年典型考点题库附带答案详解试卷3套
- 2025广西投资集团有限公司招聘4人笔试历年备考题库附带答案详解试卷3套
- 祖国不会忘记二声部合唱简谱
- 血管内导管相关性血流感染预防与诊治指南2025
- 2025年中级会计财务管理真题及答案
- 农行笔试真题全套及答案
评论
0/150
提交评论