




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2020/9/17,人类基因体计划,1,人类基因体计划,The sequence of the human genome,人类基因体计划(续),2020/9/17,人类基因体计划,3,2020/9/17,人类基因体计划,4,人类基因体计划 (Human Genome Project, HGP),1985年美国能源部(DOE)健康总署和环境部门提出 1987年启动 1988年9月美国国家卫生院(NIH)建立专门机构 1988年Celera公司加入基因定序研究 2001年2月宣布人类基因舆图完成 完成人类DNA中30亿个硷基的排序 辨识出人类DNA中30,000个基因 生物技术进入人类基因图谱后世
2、代(Post-genomic era),2020/9/17,人类基因体计划,5,人类基因体计划(续),2020/9/17,人类基因体计划,6,人类基因体计划,2020/9/17,人类基因体计划,7,已完成排序的大基因体,1995-2002 About 35 bacterial genomes; 细菌 0.5-5 Mb; hundreds to 2000 genes 1996 April Yeast (Saccharomyces cerevisiae) 12 Mb, 5,500 genes 酵母 1998 Dec. -Worm (Caenorhabditis elegans) 97 Mb, 19
3、,000 genes 线虫 2000 March - Fly (Drosophila melanogaster) 137 Mb, 13,500 genes 果蝇 2000 Dec. - Mustard (Arabidopsis thaliana) 125 Mb, 25,498 genes 阿拉伯芥 2000 June Human (Homo sapiens) 1st rough draft 2001 Feb 15/16 Human, “working draft 人类 3000 Mb, 35,00040,000 genes,已完成排序的大基因体,CBLNCU,2020/9/17,人类基因体计划
4、,8,Sequenced eukaryotic genomes,2020/9/17,人类基因体计划,9,人类基因体的定序概况,人类基因体计划在草图完成主要的突破 人类遗传图谱的完成 定序技术进步 任意定序方式(shotgun) EST的发展 其他物种定序的完成 最困难的部分 异染色丝(Heterochromatin) 重复性的序列(repetitive sequence) 重复区段(duplicate),2020/9/17,人类基因体计划,10,霰弹枪法决定全基因体序列,由上而下的策略 需做基因库(library)与定序两种人才 决定图谱(mapping)是的速率决定步骤 霰弹枪法决定全基因体
5、序列 做完基因库后,只需定序人才 增加定序仪,即可增加定序的速率 单一步骤,可平行处理,2020/9/17,人类基因体计划,11,具争议性的Craig Venter,表现序列标帜(expressed sequence tag, EST) 以霰弹枪法决定微生物的全基因体序列 以霰弹枪法决定果蝇与人的全基因体序列,Picture taken from ,2020/9/17,人类基因体计划,12,人类基因体的基本特性,人类基因体初估3200Mb,可找到30000多个基因 基因的密度约为每1215Mb出现一个基因 在染色体富含G,C的地方,通常基因较多 在3.2Gb的基因体中,2.95Gb为真染色丝(
6、euchromatin) 超过一半的基因体都是一些重复性的序列 估计有1.4106个SNP 在染色体中节及末端附近有许多从染色体其他处甚至其他染色体复制来的区段(duplicate) 基因大小平均为30kb,差异很大,2020/9/17,人类基因体计划,13,人类基因体的基本特性,人类基因的复杂性高,不需以增加基因数量来进化 蛋白质的复杂性较高 一个基因产生多个蛋白质产物 基因的调控方式较精致 人类基因数量可能被低估 人类基因的intron较长 有些地方尚未定序完成异染色丝区 基因预测软件是根据已知的基因为基础预测序列中含有基因之可能性,对于一些完全未知的基因则无法侦测,2020/9/17,人
7、类基因体计划,14,人类基因体及基他已定序生物的比较,负责基本生命现象的基因仍占多数 人类在演化上并未增加太多新的domain 人类在每个蛋白质家族中的数量较其他动物多,2020/9/17,人类基因体计划,15,人类基因序列能给我们什么信息,人类基因体包含约三十一亿六千四百七十万个(3,164,700,00)核甘酸硷基(A, C, T, G) 一般的基因平均含有三千个硷基,但其大小变异很大,最大的人类基因是 dystrophin,含有二百四十万个硷基 基因总数估计在 30,000 至 35,000 之间,这比以前估计的在 80,000 至 140,000 之间少,原因是以前是根据富含基因区域基
8、因数推延所估计,相对于现在是基因富含区与基因贫乏区所组合而成 所有的人类中,几乎是所有的(99.9%)的核甘酸硷基是完全相同的 在已发现的基因中,超过的 50% 基因其功能仍是未知,2020/9/17,人类基因体计划,16,生物信息的应用(1/2),生物医学: 找寻造成疾病的基因 遗传学: DNA序列的变异 个人识别 (基因指纹技术) 人类学: SNPs个体间之遗传变化 分类学: 序列分析 生物分类 演化学: 序列比对 物种演化关系,诊断疾病的方法 了解疾病的成因 寻找治疗疾病的药物 个人化医疗,族群大小 迁移方式 历史性变化线索,2020/9/17,人类基因体计划,17,生物信息的应用(2/
9、2),药理学: 蛋白质结构与功能预测 药物设计 营养学: SNPs:探讨造成此类个体差异之来源 个人化的营养规划 饮食营养因子与基因之交互作用 饮食营养因子影响基因之表现。 基因变异影响营养之吸收转运、贮存、代谢利用,进而影响功能,最终影响健康。 生态学: 物种分布信息与生态环境因子之关系 预测未来生物的分布。,2020/9/17,人类基因体计划,18,分子医学(Molecular Medicine),增进疾病的诊断 由于遗传产生疾病的早期侦测 合理的药物设计 基因疗法和药物的控制系统 基因药物学-量身定作的药,2020/9/17,人类基因体计划,19,生物信息,2020/9/17,人类基因体
10、计划,20,生物学突破性进展 1959: DNA结构的发现 有具体模型去了解遗传原理 分子生物学蓬勃发展 对复制现象有深入了解 1973:遗传工程技术的建立 有改变活细胞性质的能力 使某一段特定DNA片段能被增值出来做探针 使某一段特定DNA片段能被大量表现为蛋白质 为基因体分析 定良好基础 1990:人类基因体分析计划: 生物、数理、与信息科学的整合 生物情报学,科学月刊2002年1月,生物信息,2020/9/17,人类基因体计划,21,YM-Biochem,发现DNA结构,遗传工程技 术的建立,人类基因体 分析计划?,数学、物理、化学、 统计、电脑科学的整合,1953,1973,1990,
11、生物信息(续),2020/9/17,人类基因体计划,22,生物技术产业 Potential Biotech Industries,生物医学 Biomedical,生物食品 Biofood-products,生物材料 Biomaterial,生物农业 Bioagriculture,生物资源 Bioresurces,生物环保 Bioenvironmental,生物电子 Bioelectronics,生物制程 Bioindustrial Process,2020/9/17,人类基因体计划,23,900801,2000年之前,瓶颈:信息产出,2000年之后,瓶颈:信息解读,基因信息发展趋势,2020/
12、9/17,人类基因体计划,24,900801,Bioinformatics 生物情报学,生物情报学(Bioinformatics )是有系统地收集、分类、比对、整理、连结生物分子的基因序列与各层次生物构造及其互动机制之科学与技术,其目的在了解生物细胞生理机制,提供解决生物及医学难题之方法。,DNA,DNA,RNA,Protein,Replication,Transcription,Translation,Cell,复制,转录,转译,Lead-target interaction data Clinical trial data Drug Response data,DNA and Protei
13、n sequence data Genomes and maps Expression data Protein 3-D structure and activity data,2020/9/17,人类基因体计划,25,利用大量信息做观察,形成假说,再测试假说。 (不全靠实验做观察) 主要任务是将紊乱的数据(data)整理为信息(information), 再消化这些信息而转化为知识(knowledge)。 即利用Computational Biology的理论基础及分析方式来了解序列中存在的信息。 Comparative genomics 藉由不同物种(或族群)间基因序列变异性或相似性来重建
14、分子演化历史。 Functional genomics 分析鉴定不同发育过程中相关的功能性基因及不同组织中相关基因的表现程度。 Proteomics/structural genomics 藉由同源及基因表现的分析定性基因产物 proteomics 或预测基因产物(蛋白质)结构及相关蛋白质交互作用 structural genomics,Bioinformatics 生物情报学,2020/9/17,人类基因体计划,26,900801,Experiment,Applications & Services,Specialized Database,User- Interface Software
15、Development,Programming & Computing,Methodology & Algorithm,Sequence Alignment Pattern Recognition Data Filtering Optimization Statistical Analysis,Computer Programming Parallel Computing Testing & Verification,Experimental Biology Micrarray Crystallography,生物信息技术及应用Bioinformatics Technologies & App
16、lications,Data Integration Database Management Standardization,Clinical Information,Data Sourcing,Genome Sequencing Microarray Crystallography Literature,Hardware Development,Gene Discovery Gene Functions Drug Targets Gene Variants Proteomics Phylogenics,2020/9/17,人类基因体计划,27,多态性(polymorphisms),我们每一个
17、人的遗传基因,多少含有一些遗传变异。 大部分的遗传 变异不会致病,称为(遗传的)多态性(polymorphisms)。 人类 的ABO血型就是一种多态性,由于ABO血型基因的多态性(正常 变异)(normal variations)。导致人类有A型、B型、AB型、及O 型种种不同血型。, SNP 在人类基因组中约分布着1,420,000个单硷基多态性 (singlenucleotidepolymorphisms,SNPs)分布密度非常大 每1910个硷基就有一个SNP,2020/9/17,人类基因体计划,28,重复片段序列STRs (Short Tandem Repeats),VNTR: Va
18、riable Number of Tandem Repeats,Hypervariable Regions of Human DNA Short sequence of DNA that is repeated in a head-to-tail fashion Occur at a specific chromosomal locus Interspersed throughout the human genome Number of repeated units vary between individuals,1 aatttttgta ttttttttag agacggggtt tcac
19、catgtt ggtcaggctg actatggagt 61 tattttaagg ttaatatata taaagggtat gatagaacac ttgtcatagt ttagaacgaa 121 ctaacgatag atagatagat agatagatag atagatagat agatagatag atagacagat 181 tgatagtttt tttttatctc actaaatagt ctatagtaaa catttaatta ccaatatttg 241 gtgcaattct gtcaatgagg ataaatgtgg aatcgttata attcttaaga ata
20、tatattc 301 cctctgagtt tttgatacct cagattttaa ggcc,Example: D7S280,2020/9/17,人类基因体计划,29,微生物基因体学(Microbial Genomics),病源菌的快速侦测与治疗 新能源(生物燃料) 环境监测以侦测污染物 保护免于生物和化学战的伤害 安全、有效的有毒废弃物清除,2020/9/17,人类基因体计划,30,风险评估(Risk Assessment),评估放射线暴露对健康所带来的风险与伤害 评估暴露于致突变化学物和致癌毒物对健康所带来的风险与伤害 降低遗传性突变的可能性,2020/9/17,人类基因体计划,31
21、,古生物学、人类学、演化和人类迁移 (Bioarchaeology, Anthropology, Evolution, and Human Migration),在系谱中经由生殖细胞的突变研究演化 基于母系遗传研究不同族群的迁移变化 研究染色体的突变,以追溯男性的系谱和迁移 将突变演化中之转折点与族群的年龄和历史事件作比较,2020/9/17,人类基因体计划,32,比较蛋白质/ DNA序列可找出基因/物种的亲缘关系,简化生命树,人类,酵母,大肠杆菌,人类/线虫/果蝇核受体蛋白质亲缘树,CBLNCU,真细菌,真核生物,古细菌,2020/9/17,人类基因体计划,33,有很多方法比较生命序列的异同
22、,有很多方法比较生命序列的异同,简化生命树 红:序列比对法 黑:寡核甘酸频率法,真细菌,真核生物,古细菌,CBLNCU内蒙古大学,2020/9/17,人类基因体计划,34,DNA 指认(法医学)DNA Identification (Forensics),指认可能的嫌犯,其 DNA 与留在犯罪现场的证据相符合 为被错误指控的无辜人员洗清嫌疑。 指认犯罪和灾难的受害者。 建立亲子与其他亲属的关系。 指认濒临绝种和保育类动物,以协助保育动物官员执行任务。 侦测可能污染空气、水源、土壤和食物的细菌和其他病媒。 在器官移植手术中,检查捐献者与接受者的吻合性。 决定植物种子或家畜品种的系谱。 对消费品的
23、认证,如鱼子酱或葡萄酒等,2020/9/17,人类基因体计划,35,农业、家畜品种和生物加工 Agriculture, Livestock Breeding, and Bioprocessing,抗病、抗虫害、抗乾旱的作物 较健康、生产效能较高、抗疾病的家畜 营养价值较高的农产品 生物性杀虫剂 与食物产品结合的可食用疫苗 使用植物做为清除环境污染之用,2020/9/17,人类基因体计划,36,我们仍未知的(1),基因总数、确定位置、和其功能 基因调控 DNA 序列的组织结构 染色体的结构与组织 非编码 DNA 的种类、数量、分布、信息内容和功能 基因表现、蛋白质合成、和转译后事件的协调 在复杂的分子机器中蛋白质的交互作用 预期相对于实验证明的基因功能 有机体之间在演化上的保守性(conservation),2020/9/17,人类基因体计划,37,我们仍未知的(2),蛋白质的保守性(包括结构与功能) 有机体的蛋白质体学(Proteomes)(所有的蛋白质内容与功能
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 原画角色面试题及答案
- 电器防爆考试题及答案
- 滑膜炎考试题及答案
- 康复面试考试题及答案
- 2025年工程物理专业毕业设计开题报告
- 2025年城市水系统工程专业毕业设计开题报告
- 北京市海淀区2024-2025学年上学期高三期末练习生物答案
- 2025年社区民生考试题库
- 2025年麻醉药试题及答案
- 学堂在线 大数据系统基础 章节测试答案
- 62个重大事故隐患判定标准汇编(公开版)
- 2025年历史文化街区保护与城市更新文化遗产保护现状分析报告
- 胸膜间皮瘤的护理查房
- 网络工程工期承诺及安全保证措施
- 建筑材料供应详细供货方案及质量保证措施
- 临床护理值班管理制度
- 老年呼吸系统疾病及护理
- 施工现场生态环境保护措施
- 2024年江苏省阜宁县安监局公开招聘试题含答案分析
- 2025年乡镇土地租赁合同范本
- 快递柜安装协议书
评论
0/150
提交评论