




已阅读5页,还剩60页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Genome-wide Association Study -GWAS 发展历史 1996年Risch最早提出了GWAS设想; 2001年Hansen等最早应用GWAS于植物 Sea beet的研究中; 2005年Klein等在Science杂志上最早报道 了GWAS在人类中的研究,发现了与年龄相 关性的黄斑变性病症显著相关的基因。 什么是GWAS 全基因组关联分析:利用全基因组范围内 筛选出高密度的分子标记对所研究的群体 进行扫描,分析扫描得出的分子标记数据 与表型性状之间关联关系的方法。即: GWAS利用全基因组范围内的LD(连锁不平 衡)来确定影响某些表型性状或数量性状 的基因。 分子标记 是遗传标记的一种 遗传标记(genetic marker):指可追踪染色 体、染色体某一阶段、某个基因座在家系中传 递的任何一种遗传特性。 基本特征:可遗传性、可识别性 遗传标记类型 形态标记(morphological markers) 细胞学标记(cytological markers) 生化标记(biochemical markers) 分子标记(molecular markers) 形态学标记 能够用肉眼识别和观察,并能明确显示遗 传多态性的外部形态特征 优点:简单直观、经济方便; 缺点:标记数少、多态性低、容易受环境 条件的影响、并且有一些标记与不良形状 连锁。 细胞学标记 能够显示遗传多态性的细胞学特征。主要指染 色体核型、带型和数量特性的变异等,它们反 映了染色体在结构和数量上的遗传多态性。 染色体核型:数量、大小、着丝粒位置等; 染色体数量:单体、缺体、三体等; 染色体结构:缺失、易位、倒位、重复等。 特点: 优点:不易受环境影响,呈孟德尔方式遗传; 缺点:常伴有对生物有害的表型效应,难以获得相 应的标记材料;或者观测和鉴定比较困难;需要花 费较大的人力和较长时间来培育,难度较大等。 生物标记 是指以生物体内的某些生化形状作遗传标 记,如血型、血清蛋白、种子储藏蛋白、 同工酶和等位酶等。 特点: 优点:表现近中性,对生物经济性状一般没有 大的不良影响;直接反映基因产物差异,受环 境影响较小。 缺点:可用标记数量少,染色方法和电泳技术 有一定难度。 分子标记 广义:是指可遗传的并可检测的DNA序列或蛋 白质。 狭义:DNA标记,指能反映生物个体或种群间 基因组中某种差异的特异DNA片段。 优势: 直接以DNA的形式表现,在生物体的各个组织、各 个发育阶段可检测到,不受季节、环境限制。 数量多 多态性高; 表现为中性,不影响目标形状的表达 许多标记表现为共显性,能区别纯合体和杂合体 第一代:限制性片段长度多态性 (Restriction Fragment Length Polymorphism, RFLP) 第二代:微卫星多态性(microsatellite) 第三代:SNP SNP:Single Nucleotide Polymorphism,单核苷酸多态性 指同一位点不同等位基因 之间核苷酸的差异。 分子标记 1.理论上讲,SNP既可能是二等位多态性,也可能是3个或4个等 位多态性,但后两者非常少见,几乎可以忽略; 2.占所有已知多态性的90%以上; 3. SNP数目:目前,测得大约15003000万个SNP位点。 4.分为:同义SNP(synonymous SNP)和非同义SNP(non- synonymous SNP)。 SNPs的基因型 人体除性染色体外,每个染色体都有两份,个 体所拥有的一对等位基因的类型称作基因型。 核定个体的基因型,称作基因分型。 SNP 双等位基因标记 主要等位基因(major allele):在一般人群中 较多见的等位基因; 次要等位基因(minor allele): 四种可能的形式 一种转换( CT或GA):2/3 三种颠换(CA或GT, CG或GC,TA或AT) SNP作为遗传标记的优势 变异程度不如微卫星 数量巨大,分布密度高:人类基因组中1SNP/1000bp 更稳定的遗传特性:多数并不位于基因编码区,甚至 不在基因区,稳定而无害 基因分型简单:快速、大批量、自动化 SNP概念界定 基因组DNA的差异 cDNA中发现的:可能是RNA编辑的结果? 单碱基的插入和缺失? 疾病易感等位基因? 在正常人(无病个体)中可出现 SNP & mutation 基因型和表型 SNP的检测 PCR SNP芯片 新一代测序 GWAS的目的 寻找哪些SNP标记与疾病相关 关联分析 基本流程 1. 建立研究群体,选择尽可能大的群体作研 究样本,建立目标性状数据库。 2. 提取样本DNA,进行质量控制以达到基因 分型的要求,对基因型数据进行检测和质 量控制以达到后续关联分析的要求。 3. 利用合适的统计模型对SNP和目标性状进 行关联分析; 4. 对关联分析的结果进行高级分析及验证。 关联分析 GWAS分类 基于无关个体(unrelated individual)的关 联分析:(1)病例对照分析法(Case- control analysis),主要用来研究质量性状 ,即是否患病;(2)基于随机群体的关联 分析(Population-based association analysis ):主要用来研究数量性状。 基于家系的关联分析(Family-based association):传递不平衡检验法( Transmission Disequilibrium Test, TDT) GWAS分类 家系数据分析遗传标记与疾病数量表型和 质量表型的关联可以排除人群混杂对于关 联分析的影响,但其在发现阳性关联的检 验方面不如相同样本量的病例对照研究有 效。 当前的人口状况使得大规模的家系数据很 难获得,目前的研究中病例对照研究居 多。 GWAS试验设计 单阶段设计(One-stage design):一次性选用 足够大的样本量,对每一个样本都进行SNP基因型 分型,然后分析相关性状与每个SNP的关联效应; 两阶段设计(Two-stage design)或多阶段设 计(Multiple-stage design):(1)先选择一个 小样本量进行SNP分型,统计分析时在较为宽松的P 值条件下先筛选出与目标性状呈显著相关的SNPs; (2)然后在大样本中对第一步中已经筛选出的 SNPs进行分型,结合两个阶段的分析结果进行最后 统计。 质量控制 质量控制 质量控制 质量控制 质量控制 关联分析的理论基础 连锁不平衡(Linkage Disequilibrium, LD): 又称等位基因关联,是指同一条染色体上 ,两个等位基因间的非随机相关。即:当 位于同一条染色体的两个等位基因同时存 在的概率大于人群中因随机分布而同时出 现的概率时,就称这两个位点处于LD状 态。 DP(AB)-P(A)*P(B) LD产生的原因 LD的度量 D的意义 D值的95可信区间(95%) r2的意义 影响LD的因素 影响LD的因素 基于SNP的LD关联分析 基于SNP的LD关联分析 LD作图 LD作图是将一段基因的所有SNPs的LD关系 标记在基因序列中,用来观察重组热点。 作图方法有: LD散点图(dot plot) LD矩阵图(LD matrix) 邻近LD窗口分析(adjacent LD window analysis ) LD 散点图 LD矩阵图(LD matrix) 邻近LD窗口分析 关联检验的模型 假定:某个SNP位点有两个等位基因:A,a ;形成三个基因型:AA, Aa, aa。假设A是 minor位点。当我们检验该SNP位点与疾病 的关系时,我们不知道该位点以何种方式 起作用(等位,基因型,显性,隐性)。 关联检验的模型 1. Genotypic Model Hypothesis: all 3 different genotypes have different effects: AA vs. Aa vs. aa 卡方检验 关联检验的模型 2. Dominant Model Hypothesis: the genetic effects of AA and Aa are the same (assuming A is the minor allele) : AA+Aa vs. aa 关联检验的模型 3. Recessive Model Hypothesis: the genetic effects of Aa and aa are the same (A is the minor allele): AA vs. Aa+aa 关联检验的模型 4. Allelic Model Hypothesis: the genetic effects of allele A and allele a are different: A vs. a 关联检验 Odd Ratio值(OR) 关联检验中如果某SNP与某疾病的关联p值小于 显著性水平,则拒绝不关联的零假设,支持该 SNP与疾病存在关联的假设,OR值的目的是进 一步估计其关联的强度。 点估计和区间估计 关联检验 关联检验 95% CI (Confidence Interval)的计算 lnOR近似地服从正态分布 R在GWAS中的应用 Public Database HapMap SNPedia dbSNP OMIM The SNP association analysis R package: SNPassoc mySNP=snp(SNPs$snp10001, sep=“/”) The whole genome SNP association analysis data(HapMap) str(HapMap) str(HapMap.SNPs.pos) The SNP annotation and enrichment Motivation Once we have some SNPs that are potentially interesting fro
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 午餐科学搭配课件
- 硬笔点画教学课件
- 课件桥梁教学课件
- 应急处置培训课件
- 课件标准尺寸
- 课件末班教学课件
- 儿童创意口罩设计入门
- 表演基础全套课件
- 课件显示快捷方式
- 锂电行业考试题及答案
- 机车乘务员确认呼唤应答标准之基本要求电力机车乘务作业90课
- 《肾性脑病护理查房》课件
- 干部能力测试试题及答案
- 2025+CSCO胃癌诊疗指南解读
- 一级消防工程师消防安全技术综合能力考试真题卷(2025年)
- 南通市2025届高三第二次调研测试语文试题含答案
- 《科研经费管理》课件
- 成都市商品房购买(预售)合同标准版5篇
- 腹膜透析护理科普宣教
- 银行卡借用协议
- 二年级道德与法治上册 第四单元 我们生活的地方 16 家乡新变化教学实录 新人教版
评论
0/150
提交评论