生物信息学序列分析核酸和蛋白质数据库_第1页
生物信息学序列分析核酸和蛋白质数据库_第2页
生物信息学序列分析核酸和蛋白质数据库_第3页
生物信息学序列分析核酸和蛋白质数据库_第4页
生物信息学序列分析核酸和蛋白质数据库_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物信息学序列分析核酸和蛋白质数据库第1页,课件共31页,创作于2023年2月课程安排:课堂多媒体讲授:第一讲核酸和蛋白质数据库第二讲国内外文献数据库第三讲生物信息学常用软件第四讲序列的提交和序列分析

第2页,课件共31页,创作于2023年2月教材、参考书和学术期刊教材和参考书:1《生物信息学方法与实践》,张成岗和贺福初编,科学出版社,2002年6月,第1版。2、《生物信息学》,赵国屏等编,科学出版社,2002年4月,第1版。3、《基础生物信息学及应用》,蒋彦等编,清华大学出版社,2003年11月,第1版4、《简明生物信息学》,钟杨等编,高等教育出版社,2001年12月,第1版。5、《生物信息学概论》(TKAttwood,DJParry-Smith著),罗静初等译,北京大学出版社,2002年4月,第1版。6、《生物信息学-基因和蛋白质分析的实用指南》(AndreasDBaxevanis,BFFrancisOuelette著),李衍达、孙之荣等译,清华大学出版社,2000年8月,第1版。学术期刊:

第3页,课件共31页,创作于2023年2月第一讲、核酸和蛋白质数据库第4页,课件共31页,创作于2023年2月染色体基因组图谱基因组数据库核酸DNA序列核酸序列数据库蛋白质蛋白质序列蛋白质序列数据库蛋白质结构蛋白质结构数据库基因组作图序列测定结构测定生物信息学数据库工具生物信息学数据库工具二次数据库︿复合数据库﹀分子生物信息数据库概况X-衍射等物理技术第5页,课件共31页,创作于2023年2月一、核酸数据库1、国际三大核酸数据库数据库(Database)网址(Address)GenBank/genbankEMBLwww.ebi.ac.uk/emblDDBJwww.ddbj.nig.ac.jp/index-e.html第6页,课件共31页,创作于2023年2月GenBank:由美国国家生物技术信息中心(NationalCenterforBiotechnologyInformation,NCBI)建立。该中心隶属于美国国家医学图书馆,位于美国国家卫生研究院(NIH)内。EMBL:欧洲分子生物学实验室(EuropeanMolecularBiologyLaboratory,其下有EuropeanBioinformaticsCentre),主要位于英国剑桥Cambridge和德国汉堡Hamburg。DDBJ:日本DNA数据库(DNADataBankofJapan),由theNationalInstituteofGenetics,NIG主管。第7页,课件共31页,创作于2023年2月这3个大型数据库于1988年达成协议,组成合作联合体。它们每天交换信息,并对数据库DNA序列记录的统一标准达成一致。每个机构负责收集来自不同地理分布的数据(EMBL负责欧洲,GenBank负责美洲,DDBJ负责亚洲等),然后来自各地的所有信息汇总在一起,3个数据库的数据共享并向世界开放,故这3个数据库又被称为公共序列数据库(PublicSequenceDatabase)。所以从理论上说,这3个数据库所拥有的DNA序列数据是完全相同的。你可以从中选择一个你喜欢的数据库;但是如果你的研究需要实时(24小时以内)的,则要注意这些数据库间的记录是会有差异的。第8页,课件共31页,创作于2023年2月第9页,课件共31页,创作于2023年2月第10页,课件共31页,创作于2023年2月第11页,课件共31页,创作于2023年2月北京大学生物信息学中心(CentreofBioinformatics,PekingUniversity):北京华大基因研究中心(中国科学院北京基因组研究所):/bgi_new/index.htm清华大学生物系生物信息研究室:中国科学院上海生命科学研究院生物信息中心:2、我国主要生物信息学机构第12页,课件共31页,创作于2023年2月第13页,课件共31页,创作于2023年2月3、基因组数据库如:大肠杆菌基因组ECDC、酵母菌基因组CYGD、线虫基因组AceDB、果蝇基因组FlyBase、老鼠基因组MGD、人类基因组GDB、拟南芥TAIR(AtDB)数据库和水稻基因组RGP等。部分生物基因组计划网址如下:第14页,课件共31页,创作于2023年2月大肠杆菌EColi——ECDC数据库http://www.uni-giessen.de/~gx1052/ECDC/ecdc.htm酵母菌Yeast——CYGD数据库

http://mips.gsf.de/genre/proj/yeast/index.jsp线虫Caenorhabditiselegans

——AceDB数据库/genome.shtml果蝇Drosophila

——FlyBase数据库/

第15页,课件共31页,创作于2023年2月斑马鱼Zebrafish

人类Human——GDB数据库/genome/guide/human第16页,课件共31页,创作于2023年2月拟南芥

Arabidopsis——TAIR(AtDB)数据库/home.htmlhttp://www.kazusa.or.jp/kaos//tdb/e2k1/ath1//ResearchProjects/Arabidopsis/水稻Rice——RGP数据库http://rgp.dna.affrc.go.jp(http://rgp.dna.affrc.go.jp/IRGSP)(/rice)/(/tdb/e2k1/osa1/)第17页,课件共31页,创作于2023年2月第18页,课件共31页,创作于2023年2月目前完成全基因组测序工作的物种有很多,并在随时更新(update).可以进入ncbi的基因组计划二次数据库查看,其网址:/Genomes第19页,课件共31页,创作于2023年2月第20页,课件共31页,创作于2023年2月Referenceto:方刚,陈蕴佳,高歌,刘翟,何坤,吴昕,顾孝诚,罗静初.基因组数据库简介.遗传,2003,25(4):440-444第21页,课件共31页,创作于2023年2月4、学会查找和理解数据库中的数据信息第22页,课件共31页,创作于2023年2月二、蛋白质数据库第23页,课件共31页,创作于2023年2月SWISS-PROT和PIR是国际上二个主要的蛋白质序列数据库,目前这二个数据库在EMBL和GenBank数据库上均建立了镜像(mirror)站点。SWISS-PROT数据库包括了从EMBL翻译而来的蛋白质序列,这些序列经过检验和注释。该数据库主要由日内瓦大学医学生物化学系和欧洲生物信息学研究所(EBI)合作维护。SWISS-PROT的序列数量呈直线增长。第24页,课件共31页,创作于2023年2月PIR数据库的数据最初是由美国国家生物医学研究基金会(NationalBiomedicalResearchFoundation,NBRF)收集的蛋白质序列,主要翻译自GenBank的DNA序列。1988年,美国的NBRF、日本的JIPID(theJapaneseInternationalProteinSequenceDatabase日本国家蛋白质信息数据库)、德国的MIPS(MunichInformationCentreforProteinSequences摹尼黑蛋白质序列信息中心)合作,共同收集和维护PIR数据库。PIR根据注释程度(质量)分为4个等级。第25页,课件共31页,创作于2023年2月TrEMBL(TranslatedEMBL)

数据库也是一个蛋白质数据库,它包括了所有EMBL库中的蛋白质编码区序列,提供了一个非常全面的蛋白质序列数据源,但这势必导致其注释质量的下降。第26页,课件共31页,创作于2023年2月实验获得的三维蛋白质结构均贮存在蛋白质数据库PDB(ProteinDataBank)中。PDB是国际上主要的蛋白质结构数据库,虽然它没有蛋白质序列数据库那么庞大,但其增长速度很快。PDB贮存有由X射线和核磁共振(NMR)确定的结构数据。NRL-3D(NavalResearchLaboratory-3D)数据库提供了贮存在PDB库中蛋白质的序列,它可以进行与已知结构的蛋白质序列的比较。PDB和NRL-3D三维蛋白质结构数据库第27页,课件共31页,创作于2023年2月对来自PDB中每个已知三维结构的蛋白质序列进行多序列列线(multiplesequencealignment)同源性比较的结果,被贮存在HSSP(homology-derivedsecondstructuresofproteins)数据库中。被列为同源的蛋白质序列很有可能具有相同的三维结构,HSSP因此根据同源性给出了SWISS-PROT数据库中所有蛋白质序列最有可能的三维结构。要想了解对已知结构蛋白质进行等级分类的情况可利用SCOP(Structuralclassificationofproteins)数据库,在该库中可以比较某一蛋白质与已知结构蛋白的结构相似性。CATH(Class,Architecture,TopologyandHomologoussuperfamily)是与SCOP类似的一个数据库。

第28页,课件共31页,创作于2023年2月目前,瑞士生物信息学研究所(SwissInstituteofBioinformatics,SIB)创建了蛋白质分析专家系统(Expertproteinanalysissystem,ExPASy,网址:)涵盖了上述主要的数据库。我国的北京大学生物信息中心()设立了ExPASy的镜像(Mirror)。ExPASy蛋白质分析专家系统第29页,课件共31页,创作于2023年2月ProteindatabaseinNCBI

/proteinTheProteindatabaseisacollectionofsequencesfromseveralsources,includingtranslationsfromannotatedcodingregionsinGenBank,RefSeqandTPA,aswellasrecordsfromSwissProt,PIR,PRF,andPDB.Proteinsequencesarethefundamentaldeterminantsofbiologicalstructureandfunction.第30页,课件共31页,创作于2023年2月蛋白质序列中的一些符号含义蛋白质基序(motif)中的x表示任意氨基酸,其中的数字表示任意几个氨基酸;中括号[ST]表示氨基酸为SorT;大括号{P}表示除掉P之外的任意氨基酸。如:IDASN_GL

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论