w3章人类基因组学_第1页
w3章人类基因组学_第2页
w3章人类基因组学_第3页
w3章人类基因组学_第4页
w3章人类基因组学_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1

第三章人类基因组学(humangenomics)概述:第一节人类基因组和基因组学基因组(genome):一个生命体遗传信息的总和(单倍体细胞内……)人类基因组(括:核基因组和mt基因组。通常指…)基因组学(genomics):在整个基因组的层次上总体研究某一物种的所有基因的结构与功能,以及所有物种细胞的基因组在结构、功能上的异同关系。结构基因组学:数量位置距离序列基因组学功能基因组学:表达调控功能

比较基因组学:比较不同物种基因组的异同2第二节人类基因组计划(humangenomeproject,HGP)20世纪90年代重大科学项目三大计划一、计划的提出及任务1986RenatoDulbecco1990.10美国启动该计划30亿美元15年最初目标:1)构建人类基因组遗传图和物理图。2)确定人DNA全部核苷酸序列。3)定位全部基因。4)对其他生物进行类似研究。93年,增人类基因组的鉴定和分离。98年,增基因组多样性、强化功能基因组的研究。后基因组生物系统学3二、参与研究者美、英、日、法、德、中、私人企业、研究公司、制药集团。三、研究状况2000年.6.23,6国科学家公布:人类基因组序列“工作框架图”(workingdraft)(90%),引起强烈反响。2001.2.12,国际人类基因组组织(6国)和Celera公司分别在《Nature》和《

Science》公布人类基因组序列工作草图(99%)。32亿bp

3千部《红楼梦》我国科学家3p测序2004.10,公布人类基因组完成图。4四、HGP的意义理论意义:测序基因数基因功能医学意义:提供一个可资借鉴的正常人类基因信息库先知先觉……产前基因诊断…..治疗……药学意义附:我国水稻基因组研究2002,4,4,中科院

Science》绘制完成水稻基因组序列总数:46022-55615打破“生命越高级,基因数越多”的误区。5五、基因组作图和DNA测序概述

HGP任务:构建遗传图、物理图、确定DNA序列、定位基因基因组作图(genomemapping):将基因组这一巨大研究对象分解成较易操作的小的结构区域,分析研究。(一)遗传图(geneticmap)或连锁图(lingkagemap)将每条染色体上的基因或遗传标记的相对位置经连锁分析确定下来构成的图。

经计算连锁的遗传标志间的重组率,确定基因的相对距离,用厘摩表示(centrimorgan,cM),1厘摩(cM)=减数分裂时两个基因间重组率为1%。例:A和B间的重组率为2…连锁图ABC2356绘制遗传图需用多态性(遗传)标志第一代遗传标志(1975)限制性酶切片断长度多态性(restrictionfregmentlengthpolymorphism,RFLP)此类标志较少,多态信息低,应用受限。例:2000bpA基因第二代遗传标志(1989):短串联重复序列(shorttandemrepeat,STR),又称微卫星(microsatelite,MS)标志,主要为二核苷酸重复序列,如(CA)n信息量大,优于第一代。7第三代遗传标志:即单核苷酸多态性(singlenucleotidepolymorphism,SNP)

(1996)SNP定义:基因组中某一碱基的变异,频率大于1%。数量多(300多万),覆盖密度高。作用:用于遗传作图;多样性研究;识别、定位疾病相关基因。8(二)物理图(physicalmap)即确定各遗传标志之间的物理距离的图谱,以碱基对数量表示(bp,kb,mb(兆碱基))。。物理图含两方面含义:其一:指以一段已知核苷酸序列的DNA片段(即称为序列标签部位,sequencetaggedsite,STS)为“位标”,以Mb或Kb作为图距的g图.例:对STS的要求:(1)在g组中有明确的位置(2)一段已知的序列,可用PCR扩增的单拷贝序列位标A位标B位标C3kb2Mb9其二:在以上基础上构建覆盖每条CS的大片段DNA邻接克隆系(contig)ACGTCGTGCACGTCGTGCGTCGTGCSTS5STS4STS2STS3STS1STS2STS5STS6STS3STS4STS1STS2STS3STS4STS5STS6STS2STS3STS5STS4图STS与conting构建图解不同DNA片段的克隆Contig的构成10

构建物理图时,先用限制酶将染色体DNA切成一个个片段,将之插入载体进行克隆化。这些载体包括:(1)酵母人工CS(yeastartificialchromosome,YAC)插入片段长度:0.5~2个Mp大片段.(2)细菌人工CS(bacterialartificialchromosome,BAC)插入片段:80~300kb(3)P1噬菌体(bacteriophageP1)插入片段,最大125kb.(4)P1来源的人工CS(P1-deriverd~,PAC)插入片段,300kb多用BAC构建克隆,然后对BAC克隆逐一测序。将随机长度的DNA片断在染色体上的排列顺序确定下来。这些克隆DNA片断连接起来,形成重叠克隆群(Conting),再将一个个(Conting)相连成线状,覆盖整个染色体。11(三)序列图(sequencemap)

经对基因组进行序列分析所建的图。亦指对g组的大规模测序。32亿bp。1、g组DNA大规模测序(DNA测序的策略)(1)基于BAC连续克隆系的测序概括:在构建好BAC连续克隆系后(确定每一BAC所对应CS的区域),对BAC逐一测序.步骤:1)将待测BAC克隆随机切成小片段(约1.5~2kb)2)将小片段克隆入测序载体3)对小片段DNA进行8~10倍左右覆盖率的测序4)将相互重叠的读出序列(reads)组装成连续的重叠线。5)从质量最高的读出序列中取得序列。6)利用引物延伸或其他方法对BAC克隆中还存在的缝隙(gap)进行填补(gapfilling)12(2)全g组的“鸟枪法”测序[此策略不需要先构建YAC、BAC重叠群]直接将g组DNA分解成2kb左右的小片段进行随机测序,再用计算机进行策略组装。例Celera公司……测序自动化2、cDNA测序对人类g组中能转录表达的序列(即g)进行测定。2%【概括序列图过程(两种技术路线)(参考):

(1)公共序列路线:即在物理图基础上,将各个BAC克隆片段切成更短的片段,形成亚克隆分别进行测序,再将相互重叠的读出序列组装成连续重叠线。

(2)“鸟枪法”测序路线:即直接将基因组DNA分割成20kb左右的小片段进行随机测序,再用超级计算机组装成重叠线。所形成的序列图称celera序列。

……………ACGTCCGATCGGTTCATGCC

TCGGTTCATGCCAATGCCGTCC…………】133、DNA序列的生物信息学分析生物信息学:利用计算机对DNA和Pr序列资料中各种类型信息进行识别、储存、分析、模拟和传输的科学。4、g组测序的成就(1)模式生物体g组测序表g组测序现状生物体预测g数完成状况大肠杆菌4288100%面包酵母5855100%线虫18424100%果蝇13601近100%小鼠4~10万6.1%人类(01.2.15)2~2.5万99%14(2)人类g组测序1、2001-2-15,6国完成人类g组工作草图。95%2、2000-4-6,Celera,某男g组序列,99%3、1999-12,英、日、美、加、瑞科学家完成22号CS测序(33.4Mb),545g、134假g。4、2000-4,日、美、德完成21号CS测序。5、2004.10,公布人类基因组计划完成图。2006.5.18,英美完成1号CS测序,2.23亿bp,3142个基因,基因突变与350中疾病有关。15(四)基因图(genemap)据序列图,用不同方法预测出基因所在位置的图。方法:(一)CpG岛的应用CpG岛指每个基因5‵端转录起点处富含CpG的一段DNA。故,测序中,每发现一CpG岛,即意味此处有一基因。(二)计算机的应用用计算机预演系统GRAIL可从未知DNA中确认外显子。(三)cDNA策略分离出mRNA,反转录成cDNA片段,此为表达序列标签(expressedsequencetag,EST),定位后构成的图称转录图(transcriptinalmap,又称表达图expressionmap)(基因图雏形)据此可估计基因组中基因数。人基因组中基因数:2-2.5万。不同个体间基因编码差异:0.01%(past-genomeproject,PGP)主要探讨基因组的功能等。

PGP的研究领域

人类基因组多样性计划环境基因组学

功能基因组学(蛋白组学)疾病基因组学

比较基因组学药物基因组学

生物信息学

第三节后基因组计划一、人类基因组多样性计划(humangenomediversityproject,HGDP)人类基因数量约2-2.5万个人类基因组DNA含3×109bp不同个体基因编码仅有0.01%差异种族多样性族群多样性个体特异性人类基因组的多样性与同一性二、功能基因组学

功能基因组学(functionalgenomics)概念:研究基因组多样性、表达调控、对蛋白质表达和功能的研究、模式生物基因组的研究等。转录图基因表达图:三维转录图。

不同时间不同基因不同表达水平不同发育期不同组织不同表达水平同一组织同一基因三、比较基因组学(comparativegenomics)各种模式生物基因组序列的比较生物种类基因组大小预测基因组数目基因平均长度大肠杆菌4.6Mb1800约1kb

酵母12Mb5800约2kb

秀丽线虫97Mb18500约5.3kb

果蝇116Mb13600约10kb

小鼠3000Mb40000约30kb

人3164Mb2-2.5万27kb

生物基因组进化的连续性分析

21%的基因原核生物和真核生物共有

32%的基因真核生物共有而原核生物没有

24%的基因动物所共有

22%的基因脊椎动物特有四、环境基因组学(enviromentalgenomics)是研究与环境因素相关的疾病易感性基因的。

环境相关的疾病易感基因基因多态性分类环境成份相关疾病CYP1A1

激活吸烟肺癌GST解毒吸烟肺癌NAT2

解毒吸烟膀胱癌、乳腺癌

TCF2转录因子母亲吸烟唇裂、腭裂ALAD生物合成铅铅中毒

五、疾病基因组学(morbidgenomics)

主要任务是分离重要疾病的致病基因与相关基因,并确定其致病机制。

1.肿瘤癌基因和抑癌基因的定位与克隆;

2.单基因病致病基因的定位与克隆;

3.多基因病数量性状基因座(QTL)的定位与克隆。六、药物基因组学(pharmacogenomics)

是研究药物及化学物质引起机体反应上的遗传差异,即药物多态性的学科,以便能更安全有效的使用药物,和发现新的药物。

七、生物信息学(bioinformatics)

是生物学与计算机科学和应用数学交叉的一门新兴学科,对生物学实验数据的获取、加工、存储、检索与分析,进而达到揭示数据所含的生物学意义有重要作用。国际上三大公共基因数据库:

GeneBank:美国国家生物技术信息中心(NCBI)

EMBL:美国欧洲生物学信息研究所(EBI)

DDBL:日本信息生物学中心(CIB)生物信息学已改变了基础生命科学研究的运作方式,极大地提高了工作效率。第四节基因定位与克隆基因定位(genemapping)

就是用一定方法,将各个基因确定到染色体的实际位置。基因克隆(genecloning)

是从基因组中把某一基因用一定方法分离出来,以便进行单一基因精细结构和功能的研究。一、基因定位工作历史主要方法

连锁分析(linkageanalysis)

体细胞杂交(somaticcellhybridization)

原位杂交(hybridizationinsitu)

放射杂种(radiationhybrid)

计算机识别(computeridentify)1.连锁分析

同一条染色体上的不同基因呈线性连锁关系,在减数分裂后,结合家系分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论