生物信息在临床遗传的运用_第1页
生物信息在临床遗传的运用_第2页
生物信息在临床遗传的运用_第3页
生物信息在临床遗传的运用_第4页
生物信息在临床遗传的运用_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,生物信息在临床遗传的运用,2,概要,如何绘制家系图?如何获得疾病的遗传信息?如何读测序结果?如何确定序列改变性质?如何确定突变与疾病的关系?,3,一、如何绘制家系图?,4,Cyrillic2特征:,Viewupto9familiesindifferentWindowsCutandpastefamiliesorpartsoffamiliesToolbaricons,statusbarandtooltipsguidenewusersSwitchbetweentreeandcirculardisplayMaximumof10,000individualsperfamilyand250markersperchromosomeToolsforspeed-drawingofnewfamiliesSpacedrawingsevenly,5,Cyrillic2特征(续):,ColorhaplotypebarstoshowinheritanceandmultiplecrossoversCrossoverscalculatedfromphenotypedataManynewinputandoutputformatsAnnotationtool:entertextandmovetoanypositionandsettoanyfont,sizeorcolorPrintpreviewMultipleundomoveandundodeletetoolCalculatekinshipandinbreedingcoefficientsAutomaticrecognitionofconsanguinity,6,一个遗传病家系图,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,*.FAM文件只能用cyrillic打开并修改;建议家系图绘制完成后,同时以图片格式复制到WORD中,保存。,28,29,二、如何获得疾病的遗传信息?,OMIM以PKU为例介绍PubMed核酸序列数据库GenBank/,30,1.OMIM(OnlineMendelianInheritanceinMan,联机人类孟德尔遗传),OMIM是及时且权威的关于人类基因和遗传性疾病表型的纲要性数据库,是MendelianInheritanceinMan(MIM)(1998年)的不断更新电子版本,由VictorA.McKusick博士等编辑整理。该数据库从1960年开始收集数据。,31,OMIM提供了两种检索方式:根据字符串检索,可以关键词对数据库进行查询;根据基因定位检索,可根据疾病或基因所处的染色体位置,如1p21等对数据库进行查询。FTP上可以下载疾病图,基因图以及全部OMIM数据,32,33,34,OMIM条目第一个数字代表的意义,1-(100000-)Autosomaldominant(entriescreatedbeforeMay15,1994)2-(200000-)Autosomalrecessive(entriescreatedbeforeMay15,1994)3-(300000-)X-linkedlociorphenotypes4-(400000-)Y-linkedlociorphenotypes5-(500000-)Mitochondriallociorphenotypes6-(600000-)Autosomallociorphenotypes(entriescreatedafterMay15,1994),35,每个条目组成部分包括,标题(包括同义词)表型,基因产物与基因的描述疾病缺陷的性质,包括发病机理与病理生理遗传学,包括定位疾病的诊断与处理等位变异体(表型变异体,主要是疾病的分子基础)文献,36,37,38,2.PubMed,是规模最大的生物医学类文献数据库之一,建于70年代初,由美国国家医学图书馆维护;MEDLINE:收录了1966年至今世界70余个国家的4,600余种生物医学类期刊数据来源Non-MEDLINE:超出MEDLINE范围条目,PMC(PubMedCeltral)包括引用、摘要和杂志的索引术语,以及直接链接到出版商全文网址,39,40,PKU,41,42,一个数据库记录(entry)一般由两部分组成:原始序列数据和描述这些数据生物学信息的注释(annotation)。注释中包含的信息与相应的序列数据同样重要和有应用价值。,3.核酸序列数据库,43,目前国际上有3个主要的DNA序列数据库GenBankNCBI维护EMBL:EuropeanMolecularBiologyLaboratoryEBI维护DDBJ:DNADatabankofJapan日本国立遗传学研究所维护,44,表1.1三个主要DNA序列数据库网址数据库(Database)网址(Address)GenBank/Genbank/GenbankOverview.htmlEMBLhttp:/www.ebi.ac.uk/embl/DDBJhttp:/www.ddbj.nig.ac.jp/,45,46,来自于70,000多种生物的核苷酸序列数据库;GenBank序列格式与DDBJ相同,EMBL则不同;序列提交与更改:用户可以向GenBank,EMBL,DDBJ其中任意一个实验室提交序列及提交更改;GenBank序列提交工具:BankIt(少数序列;基于Web)、Sequin(多、长序列,完整基因组等;独立使用)。,47,GenBank格式可以分为三个部分:头部,包含关于整个记录的信息(描述符)特征表部分,包含了注释这一记录的特性第三部分,核苷酸序列自身所有的核苷酸数据库记录(DDBJ/EMBL/GenBank)都在最后一行以/结尾,48,1)头部,LOCUS行DEFINITIONACCESSIONVERSIONREFERENCEKEYWORDSSOURCEORGANISM,AUTHORSTITLEJOURNALMEDLINEPUBMEDREMARK,49,2)特征表,特征表它直接表达了记录的生物背景知识source是唯一一个必须在所有GenBank记录中出现的特征geneCDSCodingSequencevariationmisc-feature,50,3)序列,51,附:FASTA格式,FASTA格式广泛应用于分子生物学软件包中大于号()表示一个新序列的开始,后面紧跟序列的标记符,另起一行顶头为序列,序列是连续的,无空格等,52,53,54,目前GenBank分为多个分数据库:nr,dbEST,dbSTS,dbGSS和dbHTGS等。(1)nr(non-redudant)是非冗余的核酸数据库,存贮已知的基因全长或部分序列数据,以及完成了的基因组序列。大多序列已具有相应的基因结构分析,如编码区、调控区、重复序列等。(2)dbEST是EST数据库,EST是表达基因中的部分序列,因EST(ExpressedSequenceTags)项目本身的特点,所有EST序列都是一次测序的结果,存在较大的误差。序列较短,多为400bp以下。虽来自于表达基因,但编码情况未知。,55,(3)dbSTS是STS数据库,STS是基因组标记序列数据库,作为基因作图、基因定位的重要工具,STS(SequenceTaggedSite)为基因组DNA序列,且提供染色体定位信息。与EST相同之处是,序列较短且不提供基因功能信息。(4)dbGSS是基因组序列数据库,源于基因组DNA克隆的一次性部分测序得到的序列。它也具有序列较短、有较大的误差,不提供基因功能和定位信息。(5)dbHTGS存贮的是处理未完成阶段的基因组测序数据。基本都是BAC测序的结果。,56,3.PubMed,是规模最大的生物医学类文献数据库之一,建于70年代初,由美国国家医学图书馆维护;MEDLINE:收录了1966年至今世界70余个国家的4,600余种生物医学类期刊数据来源Non-MEDLINE:超出MEDLINE范围条目,PMC(PubMedCeltral)包括引用、摘要和杂志的索引术语,以及直接链接到出版商全文网址,57,58,59,60,三、如何读测序结果?,DNAStar,61,62,EditSeqIncludedwithallsystems,convertssequenceformatsandallowseditingGeneQuestDiscoveryandannotationofgenesMegAlign-AlignmentofDNAandproteinsequencesProteanProteinStructurepredictionPrimerSelectPrimerdesignandcomparisonanalysisMapDrawRestrictionSiteLocatorSeqmanAssembleintoacontig,63,EditSeq,转化数据格式为DNASTAR所有模块识别的格式可以导入的数据格式:Textfiles、FastAfiles、Genbankflantfiles、Tracefiles、GCGfiles等;输出的数据格式:FastAfiles、Genbankflantfiles、GCGfiles;DNA序列编辑:大小写转化;查找碱基、ORF;编辑序列特征;提供反向互补和反向序列;翻译;碱基统计氨基酸序列编辑:大小写转化;查找氨基酸;编辑序列特征;逆翻译氨基酸为DNA;氨基酸统计新的版本增加有连线Blast和序列搜索功能,64,EditSeq输出文件格式:*.SEQ,65,66,67,Seqman,做序列组装(Assembly)、Alignment看测序图按6种阅读框翻译输入、编辑和输出PhrapAssemblies过滤掉载体序列、质量低的测序序列,68,输入文件格式为:*.SEQ*.ABI输出文件格式为:*.sqd,69,70,71,72,73,74,75,Ctrl+D,76,77,78,79,四、如何确定序列改变性质?(SNPorMutation),dbSNP:/SNP/NCBI维护,启动最早,收集数据最多的公共数据库;包括SNPs,小的缺失/插入,微卫星变异等;ss编号:所有研究者提交SNP时生成IDrs编号:已有数据比较后,独特的,80,81,82,五、如何确定突变与疾病的关系?,HGMD(HumanGenomeMutationDatabase)位于英国Cardiff医学遗传学研究所,主要收录人类遗传病的致病基因;已合并在Celera公司的CDS(CeleraDiscoverySystem)中。,http:/

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论