(动物学专业论文)全基因组扫描的数据库开发和成人身高的统计遗传学研究.pdf_第1页
(动物学专业论文)全基因组扫描的数据库开发和成人身高的统计遗传学研究.pdf_第2页
(动物学专业论文)全基因组扫描的数据库开发和成人身高的统计遗传学研究.pdf_第3页
(动物学专业论文)全基因组扫描的数据库开发和成人身高的统计遗传学研究.pdf_第4页
(动物学专业论文)全基因组扫描的数据库开发和成人身高的统计遗传学研究.pdf_第5页
已阅读5页,还剩98页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

释人群中1 7 2 的身高差异。我们的研究为进一步在c i - ,国人群。i ,定位和鉴定 对成人身高起重要影响的遗传因子提供了重要的理论依据。 关键词:数据库管理系统( d b m s ) ,面向对象设计,j a v a2 j 卜厶h 爪j j 2 2 、”f f 川i g 矗x ( j 2 e e ) ,复杂分离分析,成人身;岛,i ,i 到人腓 第一章前言 第一章前言 分子生物学技术的突飞猛进,将生命科学研究引入到了一个以人类基凶 组计划( h u m a ng e n o m ep r o j e c t ,j i g p ) 为代表的前所未有的新局而。现阶段, 高通量、高精度的基因分型技术已经相当成热。其规模、速度和精确度都足 过去几乎无法想象的。这使得我们能够从全基凶组水平上、大规模样本一 一全 面而准确地搜寻与人类复杂性状或疾病相关的基因。这给传统的人类统计遗 传学注入了许多新的工作思路和活力,从而大大加快了其剖析复杂性状或疾 病遗传机理的进程。以微卫星、单核柏:酸多态性( s i n g l en u c l e o t i d e p o l y m o r p h i s m s ,s n p ) 为遗传标记的复杂性状或疾病全基凼组扫描作为一种更 高效的现代分子统计遗传方法就被适时地提出,且墩得了不小的成功,例如 d e n g 等的一些研究“。但与此同时,遗传学家们面临着一项新的挑战如 何有效地管理,并充分利用如此巨量的基因型,表型以及家系数据。 采用信息学的方法管理现代生物学海量而复杂的实验数据,已经成为必 然的选择。生物信息学是一门以对生物信息的获耿、加工、存储、分配、分 析和释读等为目标的新型交叉学科。它从信息学的角度,对现代生物学中海 量而复杂的数据进行科学、有效地管理。建立发达、复杂和可互交流的数据 库系统便是其首要任务h 。今天高度发达、日新月异的i n t e r n e t 技术为其充分 实施提供了很好的条件,并且很快就有了许多成功的案例如:n c b i 、e b i 等。 而且国际上,已有一些的研究组织开始从事关于全基因组扫描统计遗传学研 究的生物信息学数据库开发,取得了一定的成绩,积累了不少的经验,但需 要改进的地方也不少。 解析人类复杂性状或疾病遗传机巡长期以来就成为遗传学家们的挑战。 复杂性状不同于由单基因作用而呈现传统的盂德尔遗传的性状,它一般山多 个基因和环境以及二者的交互作j | _ f 1 共同决定,如糖尿病,商j f i l 压,骨质疏松 症等啤”。成人身高作为一种典型的人类复杂性状一直受到国际统计遗传学家 的关注。但在中国人群这个世界最大的人群中却研究得甚少。如果我们认为 第一章新言 复杂性状,在不同的人种中可能有不同的遗传决定模式的话,那么对其在l 卜 国人群的遗传学的研究将会大大丰富我们对复杂性状的决定帆制的了解。更 进一步而言,如果能将相关的研究成果应。f i 到实际应用以提高整个人类身体 素质,这也将会是对人类的很有意义的贡献。 1 1 生物信息学简介 生物信息学( b i o i n f o r m a t i c s ) 是8 0 i l z 代未随着人类基因组计划的启动 而兴起且正在蓬勃发展的- n 新的交叉学科,要对其下一个全而而准确的定 义似乎不大容易。山于生物科学家们各自所从事的具体领域4 i 同,因此存在 着形形色色的理解,并没有一个统的概念。但对其现阶段的工作目标基本 上还是有一定程度的共识。生物信息学是生物学与计算机科学以及应用数学 等学科相互交叉而形成的一门新兴学科。它通过对生物学实验数据的获取、 加工、存储、检索与分析,进而达到揭示数据所蕴含的生物学意义的目的。 山于当前生物信息学发展的主要推动力来自分子生物学,生物信息学的研究 主要集中于核苷酸和氨基酸序列的存储、分类、检索和分析等方面,所以日 前生物信息学可以狭义地定义为:将计算机科学和数学应用于生物大分子信 息的获取、加工、存储、分类、检索与分析,以达到理解这些生物大分子信 息的生物学意义的交叉学科。 生物信息学的研究范围大致可分三类:1 ) 数据库的建立与优化。国际上 著名的公共数据库有g e n e b a n k 、s w i s s p o r t 、p i r 、p d b ,另外一些公司还有内 部数据库。2 ) 培养生物信息学专业人员。3 ) 数据库的理论研究、软件的研制、 序列的排列比较( a l i g n m e n t ) 、对新序列的识别与预测等。其现有的重要研究 课题有:1 ) 大规模基因组测序中的信息分析;2 ) 新基因和新s n p | ! l p , j 发现与鉴 定;3 ) 非编码区信息结构分析;4 ) 遗传密码的起源和生物进化;5 ) 完整基 因组的比较研究;6 ) 大规模基因功能表达谱的分析;7 ) 生物大分子的结构 模拟与药物设计;8 ) 生物信息学分析方法的研究;9 ) 建立国家生物医学数 据库与服务系统:1 0 ) 应用与发展研究。 生物信息学数据库的构建,是其首要而关键的一步。目前,国际性合作 第一章前言 的几个基因组计划已经积累了超大量的生物信息并以不同组织形式构成许 多数据库其中一些属于商业数据库需要预先注册和付费才能检索,而更多数 据库足公开和免费的并可通过瓦联网络( i n t c r n e t ) 访问随着研究深入,公共 数据库越来越成为世界各地生物学家的重要给养 生物信息数据库是种类繁多。归纳起来,大体可以分为4 个大类,即基因 组数据库、核酸和蛋白质一级结构序列数据库、生物大分子( 主要是蛋白质) 三维空间结构数据库、以上述3 类数据库和文献资料为基础构建的二次数据 库。基因组数据库来自基因组作图,序列数据库来自序列测定,结构数据库 来自x 衍射和核磁共振结构测定。这些数据库是分子生物信息学的基本数据 资源,通常称为基本数据库,初始数据库,也称次数据库。根据生命科学 不同研究领域的实际需要,对基因组图谱、核酸和蛋白质序列、蛋白质结构 以及文献等数据进行分析、整理、归纳、注释,构建具有特殊生物学意义和 专门用途的二次数据库,是数据库开发的有效途径。近年来,世界各国的生 物学家和计算机科学家合作,已经开发了几百个二次数据库和复合数据库, 也称专门数据库、专业数据库、专用数据库。一般说来,次数据库的数据 库量大,更新速度快,用户面广,通常需要高性能的计算机硬件、大容量的 磁盘空间和专门的数据库管理系统支撑。例如,欧洲生物信息学研究所川 o r a c l e 数据库软件管理、维护核酸数据库e m b l 。而基因组数据库g d b 的管理、 运行则基于s y b a s e 数据库系统,即使是安装其镜象。也需要有s y b a s e 支撑。 o r a c l e 和s y b a s e 均为流行的数据库管理商业软件。而二次数据库的容量则要 小得多,更新速度也不象一次数据库那样快,也可以不用大型商业数据库软 件支撑。许多二次数据库的开发基于w e b 浏览器,使用超文本语言h t m l 和j a v a 程序编写的图形界面,有的还带有搜索程序。这类针对不同问题开发的二次 数据库的最大特点是使用方便,特别适用于计算机使用经验并不丰富的生物 学家。 1 2 面向对象软件开发方法与u m l 伴随着软件产业的蓬勃发展,软件系统变得越来越复杂,丌发成本越来 第一章前言 越高,而且在开发过程出现一系列问题,典型的例子是i b m 3 6 0 操作系统。这 一系统经历四年时间才完成,f :不断修改、补充,但每一文本仍存在上千条 的错误。这种软件开发与维护过程中遇到的一系列严重问题被人们称为“软 件危机”。出现软件危机的原因是多方面的,如软件需求变化频繁,开发工具 落后等。人们尝试从不同角度、不同层次来解决,比如j 懂格确定软件需求、 采用新的开发模型、采用计算机辅助工具等。面向对缘程序设计就是在这一 大环境中产生的。在面向对象程序改计语言产生之后,而向对织程序没汁逐 步成为编码的主流,其中所蕴涵的面向对象的思想不断向开发过程的上游和 下游发展,形成现在的面向对象分析、面向对象设计、面向对象测试等,并 起逐步发展为面向对象软件开发方法。 当前计算机业界最流行的几个单词就是分布式、并行和丽向对象这几个 术语。由此可以看到面向对象这个概念在当前计算机业界的地位。比如当前 流行的两大面向对象技术分布式组件对象模型( d i s t r i b u t e dc o m p o n e n t o b j e c tm o d e l ,d c o m ) 和公用对象请求代理体系 ( c o m m o no b j e c tr e q u e s t b r o k e ra r c h i t e c t u r e ,c o r b a ) 就是例子。当然我们实际,f j 到的还是而向对象 的编程语言,比如c + + ,j a v a 。不可否认,面向对象技术是软件技术的次革 命,在软件开发史上具有坐程鹂! 的意义。 随着o o p ( 面向对象编程) 向o o d ( 面向对象设计) 和o o ( 丽向对象分析) 的发展,最终形成面向对象的软件开发方法对象模型技术( o b j e c tm o d e l i n g t e c h n i q u e ,o m t ) 。这是一种自底向上和自项向下相结合的方法,而且它以对 象建模为基础,从而不仅考虑了输入、输出数据结构,实际上也包含了所有 对象的数据结构。所以o m t 彻底实现了面向问题的分析法( p r o b l e ma n a l y s is m e t h o d ,p a m ) 没有完全实现的目标。不仅) i lj j l ,0 0 技术在需求分析、可维护 性和可靠性这三个软件开发的关键环节和质量指标上有了实质性的突破,基 本地解决了在这些方面存在的严重问题。总而言之,面向对象系统采用了自 底向上的归纳、自顶向下的分解的方法,它通过对对象模型的建立,能够真 正建立基于用户的需求,而且系统的- j 。维护性大大改善。当前业界关于面l 句 对象建模的标准是统一建模语言( u n i f i e dm o d e l i n gl a n g u a g e ,u m l ) 。 第一章前言 u m l (:w 唧一 b m c o m s o f t w a r e r a t i o n a l u m 】) 是一种直观_ h t t p 3 0 6i 化、明确化、构建和文档化软件系统产物的通用可视化建模语言。它捕捉了 被构建系统的有关决策和理解,用来理解、设计、浏览、配置、维护以及控 制系统的信息。u m l 可以与所有的开发力。法生命阶段应j i j 领域和媒介一蚓使 用。它意图统一过去建模技术的经验,将当前软件最佳实践合并至标准的方 法。u m l 包括语义概念、标记符号和指南,具有静态、动态环境一h 的和组纵性 的部分。它可以被具有代码产生和报表生成的交互式可视建模:i 二具所支持。 u m l 规范没有定义标准过程,但可用于迭代的开发过程,并支持现有的大多数 面向对绿的开发过程。u m l 捕捉系统静态结构和动态行为的信息。系统建模成 独立对象的集合,它们互相交互以实现功能,从而最终使外部使刚者获益。 静态结构定义了对系统具有重要意义的各种对象和实现,以及邑们之间的关 系。动态行为定义了对象时间上的历史和为达成目标对象问的通讯。从不同 但是相关的视角来对系统建模,允许了多种角度对系统的理解。u m l 还包括用 包来分解模型的组织性结构,它允许软件团队将系统分解为可工作的单元, 对包之问的依赖进行理解和在复杂的丌发环境c i j 管删模型单元的版本。它包 含了表达实现上的决策和用构件来组织运行时元素的结构。u m l h i 是编程语 言。工具可以提供u m l 至各利,编程语言的代码生成,以及可以从现有的程序逆 向构筑模型。u m l 不是用于定理证明的高度正式的语言。实际一h 有很多正式的 语言,但它们不易理解或不适用于多种j 1 = i 途。u m l 是通用性的建模语言对于特 定的领域如图形用户界面( g u i ) 设计、火规模集成l l = i 路 5 计或基于规则的人工 智能更特定的语言和工具可能更加合适。u m l 是离散的建模语言它不打算列如 工程和物理的连续系统建模。u m l 是对诸如软件、硬件或数字逻辑的离敞系统 建模的通用语言“”1 。 1 3j 2 e e 程序设计 j 2 e e ,b p j a v a 2p l a t f o r m ,e n t e r p r i s ee d i t i o n ,它是美国s u n 公司刚刚 推出的一利全新概念的模型,与传统的互联网应,i f ;f 程序模型相比有着不可比 拟的优势( b ! q : z 也! 垒:! ! ! :曼垒塑j 2 呈! ) 。 当今许多企业都需要扩展他们的 第一章前言 业务范围,降低自身经营成本,缩短他们和客户之问的l i 向应时问,这就需要存 在一种简捷,快速的服务于企业,合作伙伴和雇员之间。典型的说,提供这些 服务的应用软件必须同企业信息系统( e n t e r p r i s ei n f o r m a t i o ns y s t e m ,e i s ) 相结合,并提供新的能向更为广阔的川户提供的服务。这些服务要具备以 : 的特点: a 高可用性:来满足现在的全球商业环境 b 安全性:保护用户的隐私和企业数据的安全 c 可依赖性和可扩展性:保证商业交易的正确和迅捷 通常这些服务是由分布的应用程序组成的,包括前端数据端和后端数据 源以及它们之间的一层或几层,这些中问层提供了把商业功能耵i 数据与e i s * h 结合的功能。这些中间层把客户端从复杂的商业逻辑中分离出来,利用成熟 的i n t e r n e t 技术使用户在管理上所花赞的时间最小化。 j 2 e e 正式降低了开发这种中间层服务的成本和复杂程度,因而使得服务 可以被快速的展开,并能够更轻松的面对竞争中的压力。j 2 e e 通过定义一种 标准的结构来实现它的优势,如下”: a j 2 e ea p p l i c a t i o np r o g r a m m i n gm o d e l 一一种阚于开发多层次, 瘦型客户用户程序的标准设计模型 b j 2 e ep l a t f o r m - - - 一一个标准的平台,用来整合j 2 e e 的应用程序,指 定一系列的接口和方法 c j 2 e ec o m p a t i b i l i t yt e s ts u i t e 一一套兼容测试组件,用来检测 产品是否 苛j j 2 e e 平台兼容 d j 2 e er e f e r e n c ei m p l e m e n t a t i o n 一用来示范j 2 e e 的能力 j 2 e e 可被设计为顾客,雇员,供应商,合作者提供企业级服务,这样的 应用程序天生具有复杂性,他们要访问各科,类型的数据并分发于大量的客户 端。为了更好的控制,管理这些应| j 程序,支持各种各样j i 】户的商业功能要 在中问层引入,中间层描述了一个被企业的信息技术部门紧紧控制的环境。 j 2 e e 应用程序依靠于e i s 层来存储企业的商业数据。这些数据和川来管删它的 系统是企业中的核心。 第一章前言 j 2 e e 应用程序模型通过在建立多层应用程序中最小化其复杂程度,为简 化和加速应用程序的开发迈出了重要的一步。j 2 e e s 严台具有平台无关性,全 部的系统集成解决方案建立了一个开放的市场,在这个市场- 中,每个提供商 都可以向所有的川户出售他们的产:牖。这样的一个1 l j 场鼓励提供商进行竞争, 不是试图将通过技术困缚j j j 户,而是通过提供比其它提供商更好的产,铺和服 务,例如是更好的性能、更好的工具或更好的用户支持。 j 2 e e 应用程序模型的一个重要的标就是使应川程序最小化。实现这一 点的一种方法是提高在j 2 e e 平台上运行普通任务的负担,这些普通任务包括 强制一个应用程序的安全目标,执行它的交易处理,链接它所需要的组件。 j 2 e e 提供了一利一简单的,公开的方式来说明这些行为。这些说明被分敞 的放在各部分代码中和开发描述中,开发描述是应用程序包的一部分,这些 基于x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) 的说i ! j 使应川程序开发者:, i u - i j 修改任 何组件就可以改变应用程序的作用。 1 4 人类复杂性状的特点 复杂性状是指任何不以由于单基因作用而呈现传统的孟德尔遗传( 如显 性遗传,隐性遗传) 的性状。换句话说,复杂性状是指那些由多基因和王 :境 以及二者交互效应共同决定的性状。它包括复杂疾病如糖尿病,高血压,骨 质疏松症等和数量性状如身高,体重,骨密度等。有很多因素使性状复杂化, 增加了基因鉴定的难度”叫:( 1 ) 遗传异质性:不同基因的突变会导致相同的 表型。因为在一些不同的家系中可以有不同的染色体区域与性状共分离,遗 传异质性影响基因定位。遗传异质性与等位基因异质性不同,后者是在一个 性状位点上可以有多个突变,他不影响基因定位克隆;( 2 ) 多基因遗传:一 些性状需要在多个基因上n i i g l j j 现突变。多基因遗传也使基因定位变得复杂; ( 3 ) 外显不全或散发( 拟表型) :致病基因可能出现在未发病个体中,也可 以出现在已发病的个体中。疾病的外显率因性别、年龄、环境以及其他基因 等影响而有很大差异;( 4 ) 高频率出现“致病等位基凶”:如果致病基因d 在 群体中的频率很高,即使简单的性状也难以定位。多个独立的d 可能在家系r 1 1 第一章前言 分离,一些个体可能d d 纯合子,这些都会扰乱预期的孟德尔遗传模式。因为 两条同源染色体中的任何一个都可能传递到一个受累子女,将观察3 k 至i j d 与附 近标记位点的一个特定等位基因间的连锁;( 5 ) 遗传因素的作j 刊可能较少, 可能不符合主基因模式;( 6 ) 地区及种族差异性。遗传分析叫绘了要区别j 衄 缘和非血缘亲属( 养子女和养父母) 外,考虑利一族和地区的差异也足很重要的。 有些差异代表了遗传作用,如北美华人中食道癌发病率为当地其他种族的3 4 倍。而有的是地区差异而非种族关系,如食道癌发病率在我国沿海和内地有 显著差异。另外还有环境因素作用的结果。种群之间的差异使分离基因更加 困难;( 7 ) 等位基因的连锁不平衡。连锁不平衡意味着等位基因非随机性的 关联,特定的等位基因组合体将比随机状态具有更高的出现机率。遗传研究 阐明的结果可能受到连锁不平衡的困扰,无关的基因可能与真正感兴趣的基 因相连锁;( 8 ) 上位效应;( 9 ) :基因多效性;( 1 0 ) 可能存在其他遗传机制: 性状的遗传存在多种机制,如线粒体遗传( 僻系遗传) 、基因纽印迹( 父母基 因活性不同) 、由于核甘酸重复的扩展产生的非孟德尔遗传现象、某些可遗传 的甲基化现象等等。人类对复杂性状的遗传模式的理解远远没有完善。 许多复杂性状直接或间接与人类健康有关。有些复杂疾病如高血压、骨 质疏松症、肥胖症等会严重影响公众身体健康,还会带来了很多社会问题和 心理问题。研究人类复杂性状,搜寻潜在基因是一项长期的、艰巨的任务。 它需要一些实质性的资源包括广泛收集家系,高信息的遗传标记,以及能处 理特定情形的统计方法。尽管如此,随着分子遗传学的飞速发展,对人类复 杂性状的研究已取得了突破性的成果。而且,随着人类基因组计划的即将完 成和科学技术及分析计算能力的飞速发展,现代生物学与医学的研究前沿已 经转向人类复杂疾病基因的定位与鉴定这一多学科高度交叉j i j f 究领域。 1 5 几种研究人类复杂性状遗传学分析方法 复杂分离分析在能获得大量的分型标记之前,分离分析是进行遗传 分析的一个最重要的手段。孟德尔就是第一个运用分离分析之后发现遗传定 律的。复杂性状受多基因因素影响,但性状的方差有可能山一个或几个基因 第一章前言 引起。复杂分离分析是在人类家庭系谱分析中提出的用于检测一个性状的遗 传方式是单个主基因分离,是严格的多基因遗传,还是由一个主基因和效应 微小的多基因共同作1 j 。复杂分离分析的溉合模型同时考虑性状残余的家系 相关也受多基因和环境效应的影响。在性状总的方差可分解为山主基因效虚 产生,由多基因微小效应产生,家庭环境效应产生,和随机环境效应产生的 方差的假定下,混合模型可以同时估计表型方差的各个部分。而复杂分离分 析的回归模型考虑性状的残余相关与祖先和其它共变量有关来说明家系的柑 关。回归模型因为考虑了主基n ;f 1 1 家系相关的复杂形式包括配偶问,父嵯f 与 子代问的表型相关,而没有要求明确的遗传和环境模式解释残余方差似乎史 受欢迎。使用回归模型,可以通过直接融入回归变量到分离分析q 。来控制一 些重要的量,而回归模型下的计算也比混合模型下的要简单。复杂分离分析 要估计的参数包括传递概率、基因频率、基因型值、方差、家庭相关。在环 境模型、孟德尔传递模型、一般模型等一系列假设下,可以对模型参数作最 大似然估训,并通过比较似然率米检验每一个假设的显著性。分离分析的显 著结果有助对性状作进一步的连锁分析。 连锁分析当同一条染色体上的两个位点靠得很近,在传递给下一代它 们的等位基因共分离时,称这两个位点连锁。连锁分析的基本心恕就是通过 获取从减数分裂中的重组事件来考察家系中疾病与标记位点的共分离。传统 的参数连锁分析由于需要知道性状确定的遗传模式也被称之为m o d e l b a s e d 分析或l o ds c o r e 法“”。最简单的形式是通过计数重组与非重组来估计重组 率o ,检验。是否小于1 2 。利用通常的似然公式,这一概念拓展到研究孟德 尔疾病当重组不能计算的情形。以l o 为底的对数似然比( l o s ) 比较最大似 然和重组率为1 2 1z i 的似然之问的差异。如果仅仅通过对一个重组率进行最人 似然估计获得最大似然,则采用l o d 值= 3 作为显著性阈值,它对应p i o 。( 对大 样本,p 0 0 5 ) ;2 ) 当一般模型与环境模型比较, 拒绝后者( p 0 0 5 ) 。一但接受主基因模型,进一步约束一些参数将得到更严格 的模型。同时a k a i k e 信息标准( a i c ) 川米衢量模型的优劣,a i c 定义为 a i c = - 2 i n l + 2 ( 被估参数个数) ”“。有最小a l c 值的模型被认为是最严格的模 型因而也最适合分析的数据。 3 2 结果 3 2 1 描述性统计数据和家系关联 表3 一1 分别列出了父亲,母亲,和女儿的成人身赢的基_ = 小= 描述性统汁数据。它 给出了未用年龄调整的成人身高变异范围的信息。单凶素方差分析结果表l 刃 父亲,母亲和女儿的成人身高之问存在显著差异( p 0 0 1 ) 。父亲组的平均身高 高于母亲组,女儿组的高于母亲组的,提示性别和年龄对成人身高有一定的 影响”6 。”1 。 第三章中国人群身高的家庭相关分析和分离分析 表3 - i :3 8 5 个核心家庭共i 16 9 个个体的描述性统计数据( 均值标准差) 。未经过调整的原始效倨,一些个体的观测数据缺失。 表3 2 给出了家系相关系数,置信水平为9 5 的置信区问以及成对数。双 亲一子代的显著相关( p o 0 5 和p o 0 1 3 2 2 分离分析 复杂分离分析的结果,列于表3 - 3 。笫一列给出了非限制模型下的全局最 第三章中国a 群身高的家庭相关分析和分离分析 表3 - 3 中国人群中( 年龄和性别调整后) 成人身商的分离分析 第三章中国人群身高的家庭相关分析和分离分析 说明: “一假定i l a r d y - w e i n b e r g 平衡时的基因型频率 1 】固定参数值 ( ) 0 估计参数的标准误 ! 限制该参数值与同列上一行的相等 # 一加性模式 + 一估计参数已达到极大或极小值 n d 估计参数的个数 g m g 一普通主基固效应模型,即只有的值分别固定为1 o 0 5 和o 0 n of c 一除了把子代和同胞之问相关系数设为。外,所有的参数与非限制型模型相同 n os p - 除了把夫妻对曲相关系数设为0 外,所有曲参数与限限制型模型相同 3 3 讨论 早已公认为成人身高早已被认为是一种重要的人类复杂性状。然而,其 在中国人群c f 一进行的遗传研究儿乎没有。因此,我们对l i ,国样本的成人身高 做了家庭相关性分析承1 复杂分离分析。该样小l j l3 8 5 个核心家庭纰成,j 川, 含有i1 6 9 有信息个体。通过复杂分离分析,我们的铆f 究表l 刿一- | j 翻人群小有一 常染色体隐性作用的主基因存在。同时,在小国人群巾身高表现出显著的家 庭相关性。中国人群中的身高遗传率估计为o 6 4 7 左右( 0 1 2 2 ) 。 我们的发现与以前在其他人群,r f 一的研究结果大致相同( 例如: 5 3 ,5 5 ) 。 x u 等v ( 2 0 0 2 ) 在荷兰家庭小做了复杂分离卅究。他们支持- - , , 一l e , , - q - 基因力j : 相当的残余的多基因效应的模式,已检测剑的隐性土基凶在整个的成人身高 变异中大约占3 8 1 。在g i n s b u r g 等人( 1 9 9 8 ) f l i ) l :究中,家系样本分别从五个 有种族和地域差别的人群中获得:吉尔吉斯人,土库曼人,楚瓦什人,墨西哥 人和以色列人。除了最后一个种 ! y ;,加性模型足最适、最筋梭j i , j ,! ;l i 模型 中包含的主基因在各个人群引起的成人身高变异。l j 分别占有3 9 8 ,3 4 6 , 5 3 2 ,4 1 6 ,4 8 3 。在g i n s b u r g 等人提出的最简模式。f j ,非主基凶家族遗传 作用几乎为零。这可能暗示至少在他们的样本中对成人身高潜在的多基因效 应并不显著,而这与x u 等人的结果是不同的。在我们的研究t i i ,提出了一个 决定身高的隐性主基因模式。然而,主基凶作刚在身高变异所占部分仪为 1 7 2 。因此,在中国人群中,除了检测到的主基因外,还可能有其他遗传因 素( 如:多基因) 在调节成人身高方面自重要作用。 第三章中国人群身崭的家庭相关分析和分离分析 我们隐性作用的主基因模型的推论也是建立在以前很多类似的研究基 础上的。虽然为了减小家庭遗传异顾性的町能p i :,有一小部分数据( 整个家 庭的3 9 8 ) 被作为奇异数据给排除【5 训。然而,考虑到很多其它的因素如:性 别,年龄和其他的一些环境因子,对成人身高也有大的影响,排除一小部分 数据应不会改变推论的有效性。而且,我们的结论与以前j e 他在不同人群中 所作的研究大致相同,这也是我们推论的依据之。 总的来说,我们的研究表l ! j j 在- i ,幽人群一i 至少柏一个0 i 起成人身。向的差 异的隐性主效基因存在。通过与以往的研究比较,也可以给出身高遗传决定 的种族差异证据。同时,它也表明进一步在l _ i _ i 凼人群f ,做基于标记的遗传分 析,来定位和鉴定成人身高决定基因将会足 醍有回报性的jj :作。 结语 结语 从事科学研究,取得一定的成绩就必须全身心的投入。短短三年一h 我 在这方面的感受也颇深。研究工作到此,可以说是完成了一个阶段。尽管我 们已经付出了不少的努力,但这些研究远还没有结束。为此,在这结语部分 我想对我的研究提出以下进一步研究设想: 全基因组扫描的基因型( 微卫星、s n p ) 和性状表型生物信息学数据库管理 系统的研究开发: 我们将该软件定位予全基因组扫描,土婴原凶是凶为在全基凶组土i 描,| i 迫切需要一个能够高效管理巨量实验数据的软件。实际上即使不是来自全基 因组扫描的数据,当感觉到有必要对其采用更高效的数据库管理时,它也是 一个不错的选择。因为它已经充分考虑到了,我们在进行统计遗传学研究。i - 管理数据所需要绝大部分功能。所以,更准确而全面地说,这是一个为统计 遗传学研究数据管理服务的数据库系统,就这1 点来讲其具有一定的通用性。 因此,最主要的进一步设想就是继续把它做得功能更强大,服务更全面,充 分体现其统计遗传的专业优势,将其拓展为一个专业数据管理平台,为学术 性的甚至是商业性的组织或团体服务。 。 鉴于此想,我认为我们今后在此工作基础上的努力的方向可以从以下儿 个方面考虑: 1 软件功能加强: a ) 加强对多种数据格式的导入功能。现在我们主要考虑其对e x c e l 电子 表格和文本文件的数据导入。这两种文件格式与操作系统平台无关,儿乎可 以满足绝大多数用户的需要。在某些情形下,用户可能需要处理别的格式的 文件,如l o t u s 。我们将根据用户的需求,增加对其它格式文件的处理。 b ) 增加一些基本的统计功能,使其能够自动生成某一数据的基本报表。 c ) 增强质量控制功能。例如对一些不合理的基因型或表型数据能够随h - j 自动检测报告给用户。 结语 d ) 添加其对更多的统计遗传学分析软件的支持。 2 网络安全性加强整个系统采用多用户的机制管理数据。在一般的情况 下,基本上可以保证数掘的安全性。但随着技术的发展,网络安全问题成为 了计算机专家和信息学家们的越来越严重的挑战。任何嘲络的安全都是相对 的,没有一个网络系统是绝对安全的。在此,我们也可以说,网络安全性的 加强,应该是我们,必须要不断努力的方向。对于这一点,我们初步的预想 是,增加其用户日志管理,加密网络传输数据。 3 软件维护网站的建立。软件维护占有整个软件生存周期的绝大部分时 间。其工作主要为,改正软件中隐藏的错误( b u g ) ,使软件适应新的环境, 或者为了扩充和完善软件的功能或性能而修改软件。而这些主要来自用户在 使用过程中对该软件的反馈意见。所以,及时而热情地响应、回复用户的反 馈不但可以提高用户对软件的主持度,而且也是软件保持旺盛生命力关键因 素。因此看来,建立一个维护刚站,大量的收集用户的反馈意见,解决、同 答他们在使用软件n 寸有关的一些问题,将会是相当重要而有意义的一项工作。 中国人群成人身高复杂分离分析: 我们分离分析的结果提示,在中国人群中有引起成人身高差异的主效基 因。除此之外,高的遗传率表明,还有山其它遗传因素起重要作用。由此看 来,定位和鉴定这些遗传因素很有可能将会是一个很有回报性的工作。 很明显,对于本研究,进一步的设想就是在条件允许的情况下定位和鉴 定决定身高的遗传因子,为了近一步剖析身高的遗传决定机理。首先我们可 以用全基因组扫描的方法确定显著性的连锁区域,然后再用有关的方法( 如 关联研究) 在选定的区域进行精细定位。精细定位后,采用位置克隆的方法, 准确地得到这些序列,进而确定其产物和调控机理。 参考文献 b i o i n 如r m a 廿c s 2 0 0 3 ;1 9 ( 1 7 ) :2 1 7 6 9 0 【8 】l ij l ,d e n gh ,l a i d b ,x uf ,o e nj ,g a og ,r e c k e r r r ,d e n g m t o w a r d k g l l 1 r o u 曲p u t g e n o t ) ,p i n g :d y n a m i ca n da u t o m a 廿cs o f t w a f ef o rm a l l i p u l a t i i 培l a 。g e - s c a l eg e n o t y p ed a b u s i n gn u o r e s c e n t l yl a b e l e dd i n u c l e o t i d em a r k e r s g e n o m ei k s 2 0 0 1 ;1 1 ( 7 ) :1 3 0 4 1 4 。 9 】p a r i k hh ,g r o o plc a n d i d a t eg e n e sf o rt ) r p e2d i a b e t e sr e ve n d o c rm e t a bd i s o r d 2 0 0 4m a ” 5 ( 2 ) :1 5 1 7 6 【1 0 】s a l em m ,f r e e d m a nb i ,l a n g e f e l dc d ,w i i l i a m sa h ,h i c k sp j ,c o l i c i g n oq ,b e c ks r ,b r o w n w m ,砧c hs s ,b o w d e nd w ,ag e n o m e - w i d es c a nf o rt y p e2d i a b e t e si na f r i c a n _ a m e r i c a n f a m i l j e sr e v e a l se v i d e n c ef o ral o c u so nc h d m o s o m e 6 q d i a b e t e s 2 0 0 4m a “5 3 ( 3 ) :8 3 0 - 7 【1 1 】v o nw o w e r nf ,b e “g t s s o nk ,l i n d b l a du ,r a s t a ml ,m e i a r t d e ro f u n c 廿o n a lv a r i a n ti nt h e ( a l p h a ) 2 ba d r e n o c e p t o rg e n e ,ap o s m o n a lc a n d i d a t eo nc h r o m o s o m e2 ,a s s o c i a t e sw i t h h y p e r t 帆s i o n h y p e r f e n s i o n 2 0 0 4m a r ;4 3 ( 3 ) :5 9 2 - 7 【1 2 】h u a n gq y ,r e c k e rr r ,d e n gh w s e a r c h i n gf o ro s t e o p o f o s i sg e n e si nt h ep o s t _ g e n o m ee r a : p r o g r e s sa n dc 1 1 a 1 1 e n g e s o s t e o p o r o si n t 2 0 0 3s e 肼1 4 ( 9 ) :7 0 1 - 1 5 【1 3 】b o o c hg ,r u m b a u 曲j ,j a c o b s o ni t h eu 1 1 i f i e dm o d e i i n gl a n g u a g er e f e m l c em a n u a l 1 9 9 6 【1 4 】b o o c hg ,r u m b a u g hj ,j a c o b s o ni t h eu n i f i e dm o d e l i n gl a n g u a g eu s e rg u i d e a d d i s o n w e s l e y ,b 0 s t 0 1 1 ju s a ,1 9 9 9 n 5 】s u b r 山m n y a ma l l a m a r a j u ,a n d r e wl o n g s h a w ,眈嘶e i0 1 c o r u l o r ,g o r d o nv a nh u i z e n ,j a s o n d i a m o n d ,j o l l ng r i f 矗n ,m a ch o l d e n ,m a r c u sd a l e y ,m a r kw 订c o x ,r i c h a r db r o w e 托 p r o f e s s i o n a ij a v as e n ,e rp r o 铲m m i n gj 2 e ee d i 石o n w r o xp r e s s ,u k 2 0 0 0 1 6 】l a n d e re s ,s c h o r kn j g e n e 6 cd i s s e c d o no fc o m p i e xt r a i t s s c i e n c e1 9 9 4s e p3 嘶2 6 5 ( 5 1 8 1 ) : 2 0 3 7 - 4 8 【1 7 】a l l i s o nd b ,h e om ,k 8 p i a nn ,m a r t i ne r s i b i i n 哥b a s e dt e s t so fl i n k a g ea n da s s o c i a 吐o nf o r q u a n t i t a t i v et r a i t s a mjh u m g e r l e t 1 9 9 9j u n ;6 4 ( 6 ) :1 7 5 4 6 3 n 8 】a 1 1 i s o nd b ,n e a 】em e z a n n o u ir ,s c h o r kn j ,a m o sc 】,b l a n g e r oj t 色s b n gt 1 1 er o b u s h l e s so f 1 el i k e n h o o d r a 旺。k s ti nav a r i a n c e - c o m p o r 忙n tq u a n h t a t i v e t r a i tl o c i - m 8 p p i n gp r o c e d u r e a m jh u mg e n e t 1 9 9 9a u 哥6 5 ( 2 ) :5 3 1 - 4 4 5 4 参考文献 m e m o d sm e dr e s 2 0 0 0 :9 :5 2 7 - 4 1 7 4 】b o r e c k ii eb o n n e yg e ,r i c et ,b 0 u c h a r dc ,r a od ci n f i u e n c eo fg e n o t ) r p e d e p e n d e n te f f e c b o fc o v a r i a t e so nt h eo u t c o m eo fs 8 9 r e g a h o na m i y s i so ft h eb o d ym a s si n d e a mjh u mg e n e t 1 9 9 3 :5 3 :6 7 6 8 7 7 5 】a k a i k eh an e wl o o ka t 廿幢s t a 廿s 6 c a lm o d e l i d e n d f i i c a 右o n i e e et r a n sa u t o m a 缸c 0 n 廿0 1 1 9 7 4 :a c 一1 9 :7 1 6 7 2 3 【7 6 】a b a s s iv g r o w t ha n dn o r m a lp u b e r t ) r p e d i a 妇s1 9 9 & 1 0 2 :5 0 7 5 1 1 【7 7 】s e e m a ne t h es 打u c t l l r a lb a s i so f b o n ef r 8 9 i l i 哆i nm e n b o n e1 9 9 9 ;2 5 :1 4 3 1 4 7 【7 8 】s p u h l e rj ma s s o r t a h v em a 6 n g w i m r e s p e c tt 0p h y s i c a lc h a r a c t e r i s t i c s s o cb i o l1 9 8 z2 9 :5 3 - 6 6 【7 9 】m a s c i e t h y i o rc g a s s o r t a 石v em a 血唱i nac o n t e m p o r a r yb r i d s hp o p u l a e o n a n nh u m b i o l 1 9 8 7 :1 4 :5 9 6 8 【8 0 】s a n c h e z a n d r e sa ,m e s am s a s s o r t a d v em a 协唱i nas p a n i s hp o p u l a t i o n :e f f e c t so fs o c i a l f a c t o r sa n dc o h a b i h d o nd m e jb i o s o cs c i1 9 9 4 ;2 6 :4 4 1 4 5 0 【8 1 】t h o m p s o nd b ,o s s o w s k iv ,j a n s s e nr c ,o w l e rw c ,b o g a r d u sc l i n k a g eb e t w e e ns t a t t l r e a n dar e g i o no nc h r o m o s o r n e2 0a n da n a l y s i so fac a n d i d a t eg e n e ,b o n em o 。p h o g e n e 右cp r o t e i n 2 a mjm e dg e n e t l 9 9 5 ;5 9 :4 9 5 5 0 0 【8 2 】r a i v i ot ,h u h t a m e m ii ,a n t t i l ar s i i r n e sm a ,h 8 9 e m sl ,n i l s s o nc ,p e t f e r s s o nkd u n k e il t h er o l eo fl u t e i n i z i n g1 1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论