




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基因组时代的动物遗传评估技术张张 勤勤 刘剑锋刘剑锋中国农业大学中国农业大学2009.8.252009.8.25哈尔滨哈尔滨遗传评估遗传评估 评估和比较动物个体在遗传上的优劣评估和比较动物个体在遗传上的优劣 为选择优秀种用个体提供依据为选择优秀种用个体提供依据 动物育种的中心工作动物育种的中心工作表现型基因型环境表现型基因型环境常规遗传评估技术常规遗传评估技术特点:利用表型进行遗传评估特点:利用表型进行遗传评估常规遗传评估技术常规遗传评估技术 blup方法是常规遗传评估技术的核心方法是常规遗传评估技术的核心yzyxazzxzzxxxeu 12a2y y:表型信息:表型信息a a:系谱信息:系谱
2、信息ezuxy常规遗传评估技术常规遗传评估技术 对很多重要经济性状十分有效对很多重要经济性状十分有效milk yield in us holsteins678910111219601970198019902000birth yearfirst lactation yield (1000 kg)geneticphenotypic美国荷斯坦奶牛产奶量表型及遗传进展美国荷斯坦奶牛产奶量表型及遗传进展加拿大猪100kg体重日龄遗传进展常规遗传评估技术常规遗传评估技术 局限性局限性 当性状表型难以获取或遗传力低时,遗传评估当性状表型难以获取或遗传力低时,遗传评估可靠性不高可靠性不高 不能进行早期遗传评估
3、不能进行早期遗传评估标记辅助选择(mas)特点:利用表型和部分基因的信息进行遗传评估特点:利用表型和部分基因的信息进行遗传评估标记辅助选择(标记辅助选择(masmas)emgzuxyy y:表型信息:表型信息a a:系谱信息:系谱信息mm: 标记信息标记信息遗传评估技术遗传评估技术 ma-blupma-blup:标记辅助选择(标记辅助选择(masmas) 应用现状应用现状实际应用不多实际应用不多应用效果不显著应用效果不显著主要原因:主要原因: 已被证实具有显著效应的基因或标记有限已被证实具有显著效应的基因或标记有限(发现并证实一个有效的基因需要很长的时间和(发现并证实一个有效的基因需要很长的时
4、间和很高的成本)很高的成本) 这些基因或标记仅能解释有限的遗传变异这些基因或标记仅能解释有限的遗传变异(10 qtl 10 qtl 50% 50% 遗传变异)遗传变异)基因组选择基因组选择 利用覆盖全基因组的高密度标记(利用覆盖全基因组的高密度标记(snpsnp)进)进行个体遗传评估行个体遗传评估 可以捕获所有的遗传变异可以捕获所有的遗传变异 无需表型信息即可进行遗传评估无需表型信息即可进行遗传评估 利用利用snpsnp芯片技术进行标记测定芯片技术进行标记测定 全基因组全基因组snpsnp芯片芯片yearno. snpchipshuman20083,000,0001000kpoultry200
5、52,800,00060kbovine20072,000,00054kpig20082,000,00060ksheep2007-50k用于遗传评估的数据用于遗传评估的数据10001112200200121110111121111011110011211000201220022201111202101200211122110021112001111001011011010220011002201101120020110102022212112210201001110001122022122211202112012020100202202000021100011202011221112111022
6、011110000212202000221012020002211220111012100111211102112110020102100022000220100020110000220221102211210112111012222001211212220020002002020201222110022222220022121111210021111200110111011200202220001112011010211121211102022100211201211001111102111211021112200010110111020220022111010201112111101120
7、210210212110110221220012110112110120220110022200210021100011100211021101110002220020221212110002220102002222121221121112002011020200122222211221202121121011001211011020022000200100200011110110012110212121112010101212022101010111110211021122111111212111210110120011111021111011111220121012121101022202
8、021211222120222002121210121210201100111222121101基因组选择基因组选择 基本步骤1. 利用一个参考群体估计每个snp的效应参考群体:每个个体都有性状表型记录和所有snp基因型2. 利用snp效应估计值计算候选群体的个体基因组育种值候选群体:每个个体都有所有snp基因型基因组选择基因组选择估计所有估计所有snp的遗传的遗传效应效应snp基因型基因型性状表型性状表型snp基因型基因型估计基因组估计基因组育种值育种值snp基因型基因型候选群体候选群体估计基因组估计基因组育种值育种值参考群体参考群体在参考群中估计标记效应在参考群中估计标记效应g gi i
9、1niiyx ge设计矩阵设计矩阵 染色体片断遗传效应染色体片断遗传效应估计标记效应估计标记效应在候选群体中计算个体在候选群体中计算个体gebvgebvpiiigxebv1g全部基因组染色体片断全部基因组染色体片断设计矩阵设计矩阵 染色体片断效应染色体片断效应4计算基因组育种值计算基因组育种值( (gebvgebv) )基因组育种值基因组育种值1 + 1 - 1 - 1 + 1 + 25 - 1 + 1 - 1 - 1 - 1 + 42 + 1 - 1 - 1 - 1 - 1 - 22 - 1 + 1 - 1 - 1 = +38- 40snpeffect- 00+ 20+ 40- 20chr
10、1chr 2chr 3.chr nknown snpsniiigebv1 gxnumber of snpssnp allele effect标记效应的估计方法最小二乘法最小二乘法岭回归和岭回归和blupblup贝叶斯方法贝叶斯方法bayesabayesa, b, c , b, c 和压缩和压缩其他方法其他方法半参数、非参数半参数、非参数机器学习、主成份分析机器学习、主成份分析最小二乘法对标记效应分布无任何假设对标记效应分布无任何假设1: 1: 对每个标记作单点回归分析对每个标记作单点回归分析2: 2: 选择效应值最大的选择效应值最大的mm个点放入模型中,同时对其个点放入模型中,同时对其进行估计
11、进行估计1nyxge1niiyx ge不足:不足:1. 1. 难以确定模型选择的阈值难以确定模型选择的阈值 2. 2. 容易高估标记效应容易高估标记效应最佳线性无偏预测和岭回归假定全部标记有相同假定全部标记有相同的方差的方差2)(gvarig 1()x xx ygi1niiyx ge22geblup:岭回归岭回归: 人为选定人为选定2222000000000.00.ggggsym.贝叶斯方法-a允许不同标记有不同的方差且服从一定分布允许不同标记有不同的方差且服从一定分布)()|()|(222iiiggiigpgppg(,| )( |, ) (, )iiipyp y gp gg数据模型数据模型方
12、差模型方差模型),(22svgi使用使用gibbs sampling!gibbs sampling!u , gi , v ve , vgi图片来自图片来自hayes,2001允许标记方差为允许标记方差为0 0概率为概率为 q概率为概率为 1-q02gi),(22svgi2012201210122012/gjniijnipjkkikiijgjniijxbxbyxxn,bayesian shrinkage标记效应越大标记效应越大, , 压缩越弱压缩越弱 标记效应越小,压缩越强标记效应越小,压缩越强贝叶斯方法-b,压缩准确性:估计育种值和真实育种值间的相关0.8480.7980.7320.31800
13、.10.20.30.40.50.60.70.80.91l ls sb bl lu up pb ba ay ye es sa ab ba ay ye es sb ba ac cc cu ur ra ac cy y r r 2 2数据来自 meuwissen al et., 2001不同方法的准确性snp add.polygenicsnp dom.y1xazuey1xaydzuey1xaea: additive snp d: dominance snpu: polygenic e: residuey y:表型信息:表型信息x: x: 遗传标记信息遗传标记信息a a:系谱信息:系谱信息模型的扩展基因
14、组选择和常规遗传估计技术基因组选择和常规遗传估计技术的育种效益比较(以奶业为例)的育种效益比较(以奶业为例) 后裔测验后裔测验 ( (数据来自加拿大数据来自加拿大) ) 每年参加后测的公牛数量每年参加后测的公牛数量: : 500500头头 每头后测公牛的育种成本每头后测公牛的育种成本: : 5 5万美元万美元 后测的总成本后测的总成本: : 25002500万美元万美元 中选公牛数目中选公牛数目: : 2020头头 每头中选公牛的育种成本每头中选公牛的育种成本: : 125125万美元万美元 年遗传进展年遗传进展: : 0.2150.215遗传标准差遗传标准差 单位遗传标准差遗传进展的育种成本
15、单位遗传标准差遗传进展的育种成本: : 1.161.16亿美元亿美元 基因组选择基因组选择 每个个体基因组标记信息测定成本:每个个体基因组标记信息测定成本:500500美元美元 基因组单倍型效应估计基因组单倍型效应估计 孙女试验设计孙女试验设计: 50: 50个公牛家系个公牛家系, , 每头公牛每头公牛5050个儿子个儿子, ,每个儿子每个儿子100100个女儿个女儿 效应估计成本:效应估计成本:125125万美元万美元 公牛母亲选择公牛母亲选择 进行进行 20002000头母牛的预选择头母牛的预选择 全部个体进行基因组标记信息测定,根据全部个体进行基因组标记信息测定,根据gebvgebv选择
16、选择10001000母牛母牛 评估成本评估成本: :100100万美元万美元基因组选择和常规遗传估计技术基因组选择和常规遗传估计技术的育种效益比较(以奶业为例)的育种效益比较(以奶业为例) 基因组选择(续)基因组选择(续) 公牛选择公牛选择 从从10001000头公牛母亲中获得头公牛母亲中获得500500头预选公牛头预选公牛 对所有公牛进行基因组标记测定,根据对所有公牛进行基因组标记测定,根据gebvgebv选择选择2020头公牛头公牛 评估成本评估成本: 25万美元万美元 2020头公牛的购买成本头公牛的购买成本: :1010万美元万美元 每头公牛连续每头公牛连续3 3年的维持费用年的维持费
17、用: : 3 3万美元万美元 每年的总育种成本每年的总育种成本: :195195万美元万美元 每年的遗传进展每年的遗传进展: : 0.4670.467遗传标准差遗传标准差 单位遗传标准差遗传进展的育种成本单位遗传标准差遗传进展的育种成本:417417万美元万美元基因组选择和常规遗传估计技术基因组选择和常规遗传估计技术的育种效益比较(以奶业为例)的育种效益比较(以奶业为例)基因组选择的另一策略基因组选择的另一策略 利用参考群体估计snp效应 选择效应显著的snp 利用选择snp的信息构建的参考群体和候选群体个体间的加性遗传相关矩阵(具有性状特异性) 用blup方法估计候选群体(无表型信息)的个体
18、育种值yzyxgzzxzzxxxu 原理:原理:参考群体参考群体及候选群及候选群体的个体体的个体育种值育种值利用利用snp的信息构建的加的信息构建的加性遗传相关矩阵性遗传相关矩阵基因型系谱基因型系谱121101011110 111211120200101121101111122221121111 101101111102 0111110120111211200110100 = homozygous for first allele (alphabetically)1 = heterozygous2 = homozygous for second allele (alphabetically)g的构建minmin1sssgijijmkkijkijgsms11ais0, 0ais1, 5 . 0ais2, 1alleleifalleleifallelsifsijk准确性准确性标记效应估计方法标记效应估计方法两种基因组选择策略的比较两种基因组选择策略的比较基因组选择在奶牛中的应用基因组选择在奶牛中的应用开始应用基开始应
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论