人类基因体计划学习_第1页
人类基因体计划学习_第2页
人类基因体计划学习_第3页
人类基因体计划学习_第4页
人类基因体计划学习_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人类基因体计划5/3/20231人类基因体计划Thesequenceofthehumangenome人类基因体计划(续)5/3/20232人类基因体计划5/3/20233人类基因体计划人类基因体计划(HumanGenomeProject,HGP)1985年美国能源部(DOE)健康总署和环境部门提出1987年启动1988年9月美国国家卫生院(NIH)建立专门机构1988年Celera公司加入基因定序研究2001年2月宣布人类基因舆图完成

→完成人类DNA中30亿个硷基的排序→辨识出人类DNA中30,000个基因→生物技术进入人类基因图谱后世代(Post-genomicera)5/3/20234人类基因体计划人类基因体计划(续)5/3/20235人类基因体计划人类基因体计划5/3/20236人类基因体计划已完成排序的大基因体1995-2002About35bacterialgenomes;细菌

0.5-5Mb;hundredsto2000genes1996AprilYeast(Saccharomyces

cerevisiae)12Mb,5,500genes酵母1998Dec.-Worm(Caenorhabditis

elegans)97Mb,19,000genes线虫2000March-Fly(Drosophilamelanogaster)137Mb,13,500genes果蝇2000Dec.-Mustard(Arabidopsisthaliana)125Mb,25,498genes阿拉伯芥2000JuneHuman(Homosapiens)1stroughdraft2001Feb15/16Human,“workingdraft"人类

3000Mb,35,000~40,000genes已完成排序的大基因体CBL@NCU5/3/20237人类基因体计划Sequencedeukaryoticgenomes5/3/20238人类基因体计划人类基因体的定序概况人类基因体计划在草图完成主要的突破人类遗传图谱的完成定序技术进步任意定序方式(shotgun)EST的发展其他物种定序的完成最困难的部分异染色丝(Heterochromatin)重复性的序列(repetitivesequence)重复区段(duplicate)5/3/20239人类基因体计划霰弹枪法决定全基因体序列由上而下的策略需做基因库(library)与定序两种人才决定图谱(mapping)是的速率决定步骤霰弹枪法决定全基因体序列做完基因库后,只需定序人才增加定序仪,即可增加定序的速率单一步骤,可平行处理5/3/202310人类基因体计划具争议性的CraigVenter表现序列标帜(expressedsequencetag,EST)以霰弹枪法决定微生物的全基因体序列以霰弹枪法决定果蝇与人的全基因体序列Picturetakenfrom/time/poy2000/mag/venter.html5/3/202311人类基因体计划人类基因体的基本特性人类基因体初估3200Mb,可找到30000多个基因基因的密度约为每12~15Mb出现一个基因在染色体富含G,C的地方,通常基因较多在3.2Gb的基因体中,2.95Gb为真染色丝(euchromatin)超过一半的基因体都是一些重复性的序列估计有1.4×106个SNP在染色体中节及末端附近有许多从染色体其他处甚至其他染色体复制来的区段(duplicate)基因大小平均为30kb,差异很大5/3/202312人类基因体计划人类基因体的基本特性人类基因的复杂性高,不需以增加基因数量来进化蛋白质的复杂性较高一个基因产生多个蛋白质产物基因的调控方式较精致人类基因数量可能被低估人类基因的intron较长有些地方尚未定序完成-异染色丝区基因预测软件是根据已知的基因为基础预测序列中含有基因之可能性,对于一些完全未知的基因则无法侦测5/3/202313人类基因体计划人类基因体及基他已定序生物的比较负责基本生命现象的基因仍占多数人类在演化上并未增加太多新的domain人类在每个蛋白质家族中的数量较其他动物多5/3/202314人类基因体计划人类基因序列能给我们什么信息人类基因体包含约三十一亿六千四百七十万个(3,164,700,00)核甘酸硷基(A,C,T,G)一般的基因平均含有三千个硷基,但其大小变异很大,最大的人类基因是dystrophin,含有二百四十万个硷基基因总数估计在30,000至35,000之间,这比以前估计的在80,000至140,000之间少,原因是以前是根据富含基因区域基因数推延所估计,相对于现在是基因富含区与基因贫乏区所组合而成所有的人类中,几乎是所有的(99.9%)的核甘酸硷基是完全相同的在已发现的基因中,超过的50%基因其功能仍是未知5/3/202315人类基因体计划生物信息的应用(1/2)生物医学:找寻造成疾病的基因遗传学:DNA序列的变异个人识别

(基因指纹技术)人类学:SNPs个体间之遗传变化分类学:序列分析生物分类演化学:序列比对物种演化关系诊断疾病的方法了解疾病的成因寻找治疗疾病的药物个人化医疗族群大小迁移方式历史性变化线索5/3/202316人类基因体计划生物信息的应用(2/2)药理学:蛋白质结构与功能预测药物设计营养学:SNPs:探讨造成此类个体差异之来源个人化的营养规划「饮食营养因子」与基因之交互作用饮食营养因子影响基因之表现。基因变异影响营养之吸收转运、贮存、代谢利用,进而影响功能,最终影响健康。生态学:物种分布信息与生态环境因子之关系预测未来生物的分布。5/3/202317人类基因体计划分子医学(MolecularMedicine)增进疾病的诊断由于遗传产生疾病的早期侦测合理的药物设计基因疗法和药物的控制系统基因药物学---量身定作的药5/3/202318人类基因体计划生物信息5/3/202319人类基因体计划生物学突破性进展1959:DNA结构的发现有具体模型去了解遗传原理 分子生物学蓬勃发展对复制现象有深入了解1973:遗传工程技术的建立有改变活细胞性质的能力使某一段特定DNA片段能被增值出来做探针使某一段特定DNA片段能被大量表现为蛋白质为基因体分析定良好基础1990:「人类基因体」分析计划:

生物、数理、与信息科学的整合生物情报学科学月刊2002年1月生物信息5/3/202320人类基因体计划YM-Biochem发现DNA结构遗传工程技术的建立「人类基因体」分析计划?数学、物理、化学、统计、电脑科学的整合195319731990生物信息(续)5/3/202321人类基因体计划生物技术产业PotentialBiotechIndustries生物医学Biomedical生物食品Biofood-products生物材料Biomaterial生物农业Bioagriculture生物资源Bioresurces生物环保Bioenvironmental生物电子Bioelectronics生物制程BioindustrialProcess5/3/202322人类基因体计划9008012000年之前,瓶颈:信息产出1990US$3-5/base1997

US$0.5/base2000US$0.2/base2002US$0.1/base2003US$0.01/base2004US$0.05/base2000年之后,瓶颈:信息解读基因信息发展趋势5/3/202323人类基因体计划900801Bioinformatics生物情报学生物情报学(Bioinformatics)是有系统地收集、分类、比对、整理、连结生物分子的基因序列与各层次生物构造及其互动机制之科学与技术,其目的在了解生物细胞生理机制,提供解决生物及医学难题之方法。DNADNARNAProteinReplicationTranscriptionTranslationCell复制转录转译Lead-targetinteractiondataClinicaltrialdataDrugResponsedataDNAandProteinsequencedataGenomesandmapsExpressiondataProtein3-Dstructureandactivitydata5/3/202324人类基因体计划利用大量信息做观察,形成假说,再测试假说。(不全靠实验做观察)主要任务是将紊乱的数据(data)整理为信息(information),再消化这些信息而转化为知识(knowledge)。即利用ComputationalBiology的理论基础及分析方式来了解序列中存在的信息。Comparativegenomics藉由不同物种(或族群)间基因序列变异性或相似性来重建分子演化历史。Functionalgenomics分析鉴定不同发育过程中相关的功能性基因及不同组织中相关基因的表现程度。Proteomics/structuralgenomics藉由同源及基因表现的分析定性基因产物proteomics或预测基因产物(蛋白质)结构及相关蛋白质交互作用structuralgenomics

Bioinformatics生物情报学5/3/202325人类基因体计划900801ExperimentApplications

&ServicesSpecializedDatabaseUser-InterfaceSoftware

DevelopmentProgramming&ComputingMethodology&AlgorithmSequenceAlignmentPatternRecognitionDataFilteringOptimizationStatisticalAnalysisComputer

ProgrammingParallelComputingTesting&

VerificationExperimentalBiologyMicrarray

Crystallography生物信息技术及应用

BioinformaticsTechnologies&ApplicationsDataIntegrationDatabase

ManagementStandardizationClinicalInformationData

SourcingGenomeSequencingMicroarrayCrystallographyLiteratureHardwareDevelopmentGeneDiscoveryGeneFunctionsDrugTargetsGeneVariantsProteomicsPhylogenics5/3/202326人类基因体计划多态性(polymorphisms)我们每一个人的遗传基因,多少含有一些遗传变异。大部分的遗传变异不会致病,称为(遗传的)多态性(polymorphisms)。人类的ABO血型就是一种多态性,由于ABO血型基因的多态性(正常变异)(normalvariations)。导致人类有A型、B型、AB型、及O型种种不同血型。☆SNP在人类基因组中约分布着1,420,000个单硷基多态性(single

nucleotide

polymorphisms,

SNPs)分布密度非常大每1910个硷基就有一个SNP5/3/202327人类基因体计划重复片段序列STRs(ShortTandemRepeats)VNTR:VariableNumberofTandemRepeatsHypervariableRegionsofHumanDNAShortsequenceofDNAthatisrepeatedinahead-to-tailfashionOccurataspecificchromosomallocusInterspersedthroughoutthehumangenomeNumberofrepeatedunitsvarybetweenindividuals1aatttttgta

ttttttttag

agacggggtt

tcaccatgtt

ggtcaggctg

actatggagt

61tattttaagg

ttaatatata

taaagggtat

gatagaacac

ttgtcatagt

ttagaacgaa

121ctaacgatag

atagatagat

agatagatag

atagatagat

agatagatag

atagacagat

181tgatagtttt

tttttatctc

actaaatagt

ctatagtaaa

catttaatta

ccaatatttg

241gtgcaattct

gtcaatgagg

ataaatgtgg

aatcgttata

attcttaaga

atatatattc

301cctctgagtt

tttgatacct

cagattttaa

ggcc

Example:D7S2805/3/202328人类基因体计划微生物基因体学

(MicrobialGenomics)病源菌的快速侦测与治疗新能源(生物燃料)环境监测以侦测污染物保护免于生物和化学战的伤害安全、有效的有毒废弃物清除5/3/202329人类基因体计划风险评估(RiskAssessment)评估放射线暴露对健康所带来的风险与伤害评估暴露于致突变化学物和致癌毒物对健康所带来的风险与伤害降低遗传性突变的可能性5/3/202330人类基因体计划古生物学、人类学、演化和人类迁移(Bioarchaeology,Anthropology,Evolution,andHumanMigration)在系谱中经由生殖细胞的突变研究演化基于母系遗传研究不同族群的迁移变化研究染色体的突变,以追溯男性的系谱和迁移将突变演化中之转折点与族群的年龄和历史事件作比较5/3/202331人类基因体计划比较蛋白质/DNA序列可找出

基因/物种的亲缘关系简化生命树人类酵母大肠杆菌人类/线虫/果蝇核受体蛋白质亲缘树CBL@NCU真细菌真核生物古细菌5/3/202332人类基因体计划有很多方法比较生命序列的异同有很多方法比较生命序列的异同简化生命树红:序列比对法黑:寡核甘酸频率法真细菌真核生物古细菌

CBL@NCU+内蒙古大学5/3/202333人类基因体计划DNA指认(法医学)

DNAIdentification(Forensics)指认可能的嫌犯,其DNA与留在犯罪现场的证据相符合为被错误指控的无辜人员洗清嫌疑。指认犯罪和灾难的受害者。建立亲子与其他亲属的关系。指认濒临绝种和保育类动物,以协助保育动物官员执行任务。侦测可能污染空气、水源、土壤和食物的细菌和其他病媒。在器官移植手术中,检查捐献者与接受者的吻合性。决定植物种子或家畜品种的系谱。对消费品的认证,如鱼子酱或葡萄酒等5/3/202334人类基因体计划农业、家畜品种和生物加工

Agriculture,LivestockBreeding,andBioprocessing抗病、抗虫害、抗乾旱的作物较健康、生产效能较高、抗疾病的家畜营养价值较高的农产品生物性杀虫剂与食物产品结合的可食用疫苗使用植物做为清除环境污染之用5/3/202335人类基因体计划我们仍未知的(1)基因总数、确定位置、和其功能基因调控DNA序列的组织结构染色体的结构与组织非编码DNA的种类、数量、分布、信息内容和功能基因表现、蛋白质合成、和转译后事件的协调在复杂的分子机器中蛋白质的交互作用预期相对于实验证明的基因功能有机体之间在演化上的保守性(conservation)5/3/202336人类基因体计划我们仍未知的(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论