11-9-22生物信息学资源1_第1页
11-9-22生物信息学资源1_第2页
11-9-22生物信息学资源1_第3页
11-9-22生物信息学资源1_第4页
11-9-22生物信息学资源1_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物信息学Bioinformatics1重要通知:下次课在机房上课,请自己准备好上网帐号:内容:数据库资源检索时间:下周一(9月26日)晚上19:00-21:00地点:生科楼B20192复习:细胞蛋白质核酸第二章生物信息学的生物学基础3Questions:1.蛋白质二级结构有哪些?2.TSS,外显子和内含子的概念。3.如何判断起始密码子和终止密码子?内含子?4请画出示意图:1.中心法则2.真核生物基因的一般结构5核酸中心法则

复制

DNA

转录

逆转录

复制

RNA

蛋白质

翻译

调控6TATA盒

翻译起始植物C/GAANNATGG动物A/GNNATGG

各内含子加poly(A)信号植物G/AATAA1-3动物AATAAA

终止密码子

各个外显子

加帽位点5'm7GpppNp

5'端

TSS

3'端

AGGA或CAAT盒

起始密码子

真核生物基因的结构:Promotor2000bpUTRUTR7转录翻译Promotor2000bpUTRUTR8编号名称第一章生物信息学引论第二章生物信息学的生物学基础第三章生物信息学数据库资源第四章DNA和蛋白质序列分析第五章系统发生分析第六章基因表达数据分析第七章其他常用生物信息学工具第八章电子克隆的原理和应用第九章基本生物信息学工具的开发与应用9第三章生物信息学数据库资源10提纲:模式生物测序3大核酸数据库蛋白质数据库11提纲:模式生物测序3大核酸数据库蛋白质数据库1213humanArabidopsisThermotogamaritimaEscherichiacoliBuchnerasp.APSRickettsiaprowazekiiUreaplasmaurealyticumBacillussubtilisDrosophilamelanogasterThermoplasmaacidophilumPlasmodiumfalciparumHelicobacterpylorimouseCaenorhabitiselegansratBorreliaburgorferiBorreliaburgorferiAquifexaeolicusNeisseriameningitidisZ2491Mycobacteriumtuberculosis一、模式生物14模式生物基因组计划模式生物基因组计划酵母、线虫、果蝇、细菌、拟南芥、人类、水稻等共约50多种已完成,70余种正在进行。目前总量已达60亿碱基对!152019年2月15日《Nature》封面2019年2月16日《Science》封面16又一次成功!——水稻基因研究引言17我国自主产权的全基因组测序计划水稻(2019)家鸡(2019)家蚕(2019)家猪(2009)大熊猫(2019)18virusesplasmidsbacteriafungiplantsalgaeinsectsmollusksreptilesbirdsmammalsGenomesizesinnucleotidepairs(base-pairs)10410810510610710111010109bonyfishamphibians模式生物(ModelOrganism)病毒(Virus)不具有细胞形态结构,仅由核酸和蛋白质构成;

如:人艾滋病毒HIV、SARS冠状病毒

体积小,10~300nm;严格的专性细胞内寄生;对抗生素不敏感。电子显微镜下的SARS冠状病毒100nm20Escherichiacoli

大肠杆菌大肠杆菌是研究得最为详尽的一个模式生物。这种只有1.6微米长的、可以迅速繁殖的单细胞原核生物,已经成为实验室和基因工程的重要工具。EscherichiacoliO157:H7EscherichiacoliK12模式生物(ModelOrganism)21Saccharomycescerevisiae

酿酒酵母真菌界的单细胞真核生物,它的全基因组已在2019年测定。模式生物(ModelOrganism)22秀丽线虫Caenorhabditiselegans

一种透明的、生活在海滩泥沙中的小虫。细胞数目一定:成虫细胞数目只有959个,其中包括302个神经元;

有6条染色体,全基因组于2019年测定,长9.7Mb

模式生物(ModelOrganism)23Drosophilamelanogaster

果蝇繁殖很快、容易诱发变异的小昆虫。总长达1.8亿核苷酸。

模式生物(ModelOrganism)24Arabidopsisthaliana

拟南芥个体生活周期只有6周的十字花科小草,是一种理想的模式植物。模式生物(ModelOrganism)25Oryzasativa

水稻单子叶植物模式植物,390-430MB模式生物(ModelOrganism)26模式生物(ModelOrganism)非洲爪蟾(Xenopuslavias)

1个受精卵在24小时内分裂到各种器官初具雏形的程度;27模式生物(ModelOrganism)斑马鱼(Daniorerio)

身体透明的小鱼,生活周期约3个月,是研究脊椎动物发育过程的良好对象。28模式生物(ModelOrganism)小鼠(Musmusculus)

基因组大小与人类相近,约30亿个核苷酸对;293031提纲:模式生物测序3大核酸数据库蛋白质数据库32主要的数据库资源核酸序列数据库主要有GenBank,EMBL,DDBJ等.蛋白质序列数据库主要有SWISS-PROT,PIR,TrEMBL等,蛋白结构数据库有PDB,MMDB等,333大核酸数据库基因组数据库的相关背景。主要的基因组数据库资源。重点介绍GenBank34ATTGACTAPrimaryvs.DerivativeDatabasesACGTGCTTGACACGTGAATTGACTATATAGCCGACGTGCACGTGCACGTGCTTGACATTGACATTGACACGTGACGTGACGTGAATTGACTAATTGACTAATTGACTAATTGACTATATAGCCGTATAGCCGTATAGCCGTATAGCCGGenBankTATAGCCGTATAGCCGTATAGCCGTATAGCCGATGACATTGAGAATTATTCCGAGAATTCCGAGAATTATTCCGAGAATTCCSequencingCentersGAGAATTCCGAGAATTCCUniGeneRefSeqGenomeAssemblyLabsCuratorsAlgorithmsTATAGCCGAGCTCCGATACCGATGACAA35三大基因数据库Genbank

Genbank库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它是由美国国立生物技术信息中心(NCBI)建立和维护的。

NCBI的网址是:。EMBL核酸序列数据库

由欧洲生物信息学研究所(EBI)维护的核酸序列数据构成,查询检索可以通过通过因特网上的序列提取系统(SRS)服务完成。

数据库网址是:ebi.ac.uk/embl/。

DDBJ数据库

日本DNA数据仓库(DDBJ)也是一个全面的核酸序列数据库,与Genbank和EMBL核酸库合作交换数据。使用其主页上提供的SRS工具进行数据检索和序列分析。

DDBJ的网址是:ddbj.nig.ac.jp/。36GenBankPublicfreeAvailableviaInternetEMBLDataLibraryDDBJ(DNADataBankofJapan)三大基因数据库之间的关系37/ddbj.nig.ac.jp/index-e.htmlwww.ebi.ac.uk/embl//38美国的核酸数据库GenBank〖Banson,D.A.etal.(2019)NucleicAcidsRes.26,1-7〗从1979年开始建设,1982年正式运行;3940欧洲分子生物学实验室的EMBL数据库也于1982年开始服务41www.ebi.ac.uk/embl//42ddbj.nig.ac.jp/index-e.html43日本于1984年开始建立国家级的核酸数据库DDBJ,并于1987年正式服务。44/ddbj.nig.ac.jp/index-e.htmlwww.ebi.ac.uk/embl//45GenBank

/46TheNationalInstitutesofHealthListerHillNatcherBethesda,MD4748NCBIWebTrafficUsersperday300,000200,000100,000400,0002019201920002019201920192019500,000600,0002019ChristmasandNewYear’sDay4950515253提纲:模式生物测序3大核酸数据库蛋白质数据库54蛋白质数据库55主要的数据库资源核酸序列数据库主要有GenBank,EMBL,DDBJ等.蛋白质序列数据库主要有SWISS-PROT,PIR,TrEMBL等,蛋白结构数据库有PDB,MMDB等,与基因组有关的数据库还有dbEST,OMIM等,56PIR(ProteinInformationResource,蛋白质信息资源)于1984年正式启动,目前由美国国际蛋白质信息中心管理。SwissProt由瑞士日内瓦大学于1986年创建,目前由瑞士生物信息学研究所和欧洲生物信息学研究所EBI共同维护和管理。TrEMBL是从EMBL中的cDNA序列翻译得到的。该数据库采用SwissProt数据库格式,包含EMBL数据库中所有编码序列的翻译。57

PIR(proteininformationresource)1.由美国NCBI翻译自GenBank的DNA序列(1984年);

2.在EMBL和GenBank数据库上均建立了镜像站点;

3.数据依据注释的质量分为4类。

网址:www-/分类名称(Name)说明(Comment)记录数(Numberofentries)PIR1已分类、已注释(Classifiedandannotated)13572PIR2已注释(Annotated)69368PIR3未核实(Unverified)7508PIR4未翻译(Unencodedoruntranslated)196PIR数据库的分类情况(Release51.03)5859

SWISS-PROT

1.瑞士日内瓦大学医学生物化学系和欧洲生物信息学研究所(EBI)合作维护(1986年);

2.在EMBL和GenBank数据库上均建立了镜像站点;3.数据库包括了从EMBL翻译而来的蛋白质序列,这些序列经过检验和注释;

SWISS-PROT的网址:/sprot6061蛋白质结构数据库62主要的数据库资源核酸序列数据库主要有GenBank,EMBL,DDBJ等.蛋白质序列数据库主要有SWISS-PROT,PIR,TrEMBL等,蛋

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论