(计算机应用技术专业论文)基于组件的肠胃道微生物信息分析系统的研究.pdf_第1页
(计算机应用技术专业论文)基于组件的肠胃道微生物信息分析系统的研究.pdf_第2页
(计算机应用技术专业论文)基于组件的肠胃道微生物信息分析系统的研究.pdf_第3页
(计算机应用技术专业论文)基于组件的肠胃道微生物信息分析系统的研究.pdf_第4页
(计算机应用技术专业论文)基于组件的肠胃道微生物信息分析系统的研究.pdf_第5页
已阅读5页,还剩49页未读 继续免费阅读

(计算机应用技术专业论文)基于组件的肠胃道微生物信息分析系统的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 二十世纪尤其是末期,生物科学技术得到迅猛发展,生物科学的数据资源也急剧膨胀。人们 开始寻求各种强大的工具来协助人脑完成这些信息的处理、分析j j 作。如今- 生物科学的重点已 由试验分析平数据积累转移到数据分析及其指导下的试验验证上来,生物科学也正在经历着一个 从分析还原思维到系统整合思维的转变。 在肉仔鸡胃肠道微生物与饲料营养的相互作用及其对肉品质的调控机理的研究项目的实施 过程中,采用了传统生物检测技术与现代生物检测技术相结合的方式,所形成的数据数量大,而 且形式多样。 本文以肉仔鸡胃肠道微生物与饲料营养的相互作用及其对肉品质的调控机理的研究项目为 背景,首先结合m v c 模式完成了系统层次的划分,阐述了系统的结构设计,然后具体研究了组 件技术、s p s s 组件通信技术、软件复用技术,在此基础上开发了数据处理分析模块中两大核心 组件,并探讨了两个组件的实现。最后,综合利用数据库技术、组件技术、w e b 应用技术和生物 统计学理论知识完成了系统的开发。 本系统的开发完成,克j t 3 传统试验数据处理方法上的缺陷,大大提高了试验的自动化程度, 具备良好的易用性,辅助了该项目研究的进一步深化。本系统的设计思想是在生物信息分析领域 的一个新的尝试。 关键词:组件技术、微生物信息分析系统、w e b 应用、软件复用 a b s t r a c t w i t ht h ed e v e l o p m e n to fb i o s c i e n c ea tt h ee n do f2 1c e n t u r y , t h ed a t ar e s o u r c eo fb i o s c i e n c ei s g r o w i n gr a p i d l y t h ep o w e r f u lt o o l sw h i c hw e r es e a r c h e df o ra s s i s tm o r ea n dm o r ep e o p l ed i s p o s i n g a n da n a l y z i n gd a t a l t s o u r e e i nt h ef u t a m ,b i o s c i e n c ew i l ll a yas t r o n ge m p h a s i so nt h ed a t aa n a l y s i s i n s t e a do f d a t aa c c u m u l a t i n g t h et h i n k i n go f b i o s c i e n c ei sf r o ms y s t e mr e v e r t i n gt os y s t e mi n t e g r a t i o n , i nt h ep r o c e s so fr e s e a r c h i n go nc h i c kg a s t r o i n t e s t i n a lt r a c tm i c r o b e ,t r a d i t i o n a la n dm o d e mb i o l o g y t e c h n o l o g yw a su s e d ag r e a td e a lo fd a t aw e r ep r o d u c e dw h i c hk i n d sa r ed i f f e r e n t ,s y s t e mf r a m e w o r k w a sd i v i d e di n t ot h r e el a y e r sw i t hm v c d e s i g np a t t e r n t h ec o m p o n e n tt e c h n o l o g y , o b j e c to fs p s sa n d s o f t w a r er e u s ew e r es t u d i e d t w oo ft h em o s ti m p o r t a n tc o m p o n e n t si nt h ed a t aa n a l y s i sm o d u l eo f s y s t e mw e r ed e v e l o p e d t h es o f t w a r es y s t e mw a sd e v e l o p e db ya l lo f t h e s et e c h n o l o g i e s w i t ht h ea c h i e v e m e n to f t h es y s t e md e v e l o p m e n t ,t r a d i t i o n a ld e f e c to nd a t ad i s p o s a lw a so v e r c o m e i ta s s i s t st h er e s e a r c ho nc h i c kg a s t r o i n t e s t i n a lt r a c tm i c r o b eb yi m p r o v i n gt h ea u t o m a t i z a t i o no f b i o s c i e n c ee x p e r i m e n t t h et h i n k i n go fd e s i g nw h i c hw a su s e do nt h es y s t e mi san e wa t t e m p ti nt h e f i e l do f m i c r o b ei n f o r m a t i o nd i s p o s i n ga n da n a l y z i n g k e y w o r d s :c o m p o n e n tt e c h n o l o g y , m i c r o b ei n f o r m a t i o na n a l y s es y s t e m ,w e ba p p l i c a t i o n ,s o f t w a r e r e u s e 独创性声明 y - 9 3 9 4 7 5 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成 果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发 表或撰写过的研究成果,也不包含为获得中国农业大学或其它教育机构的学位或证书 而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已耷论文中作了明 确的说明并表示了谢意。 研究生签名:孑寸舆 时间:多,。6 年钿日 关于论文使用授权的说明 本人完全了解中国农业大学有关保留、使用学位论文的规定,即:学校有权保留 送交论文的复印件和磁盘,允许论文被查阅和借阅,可以采用影印、缩印或扫描等复 制手段保存、汇编学位论文。同意中国农业大学可以用不同方式在不同媒体上发表、 传播学位论文的全部或部分内容。 ( 保密的学位论文在解密后应遵守此协议) 研究生签名 导师签名: 孙、奥 彦友 时间:2 “年5 月。日 时间:口硝年占月,日 中国农业大学硕士学位论文 第章绪论 1 1 课题研究背景 第一章绪论 近些年来,随着人类基因组计划和蛋向质组工程的实施,生物信息资源不断膨胀,生物信息 学的重要性日益突出1 1 l 。生物信息学是- 1 交叉科学,它包含了生物信息的获取、处理、存储、 分发、分析和解释等在内的诸多方面,它综合运用生物学、数学、物理学、化学、信息科学和计 算机科学等多学科理论、技术、方法和工具,来阐明和理解大量数据背后所蕴藏的生物学意义”。 生物信息学的发展背景始于二十世纪后期pj 。由于迅猛发展的生命科学所积累的海量数据已 经大大地超出了人脑的分析能力范围,因此人们开始采用计算机和网络技术取代传统方式,辅助 人脑进行分析综合研究从海量数据中提取能够反映生命活动规律的有效信息并在此指导下进 行试验验证,从而获得对于生命的全面深入的认识,并将其应用到社会经济活动中去。 二十世纪尤其是末期,生物科学技术的迅猛发展,无论从数量上还是从质量上,都极大地丰 富了生物科学的数据资源,数据资源的急剧膨胀首先迫使我们不得不考虑寻求一种强有力的工具 去组织他们,以利于对己知生物学知识的储存和进一步加工利用1 1 ”。大量多样化的生物学数据资 源中必然蕴含着大量重要的生物学规律,这些规律是我们解决许多生命之谜的关键所在,然而继 续沿用传统手段以人脑来分析如此庞杂的数据已经无法实现。人们需要寻求各种强大的t 具来协 助人脑完成这些信息的处理、分析工作。可以说,伴随着二十一世纪的到来,生物科学的重点和 潜在的突破点已经由二十世纪的试验分析和数据积累转移到数据分析及其指导下的试验验证上 来,生物科学也正在经历着一个从分析还原思维到系统整合思维的转变”“1 。 1 2 国内外研究现状 伴随着生物科学对生物信息分析处理工具需求的加剧,以数据处理分析为本质的计算机科学 技术和网络技术同样获得了突飞猛进的进展,计算机科学技术和网络技术日益渗透到生物科学的 方方面面。如何有效利用计算机技术来对庞杂的海量生物信息数据来进行收集、分析和处理。从 而形成有用的信息和知识,再加以传播和利用,已经成为未来生物科学的关键所在。 1 2 1 生物统计学的研究现状 随着科学技术的发展和生物信息的迅猛增长,生物学科j :作者和研究人员在研究过程中,应 用所掌握的知识设计试验或者解决实际问题时,不可避免地会遇到一个难题,即如何从试验所得 数据中找出内在规律,使实践上升为理论。这中间沟通的桥梁就是生物统计学。生物统计学的重 要任务就是对客观事物得出本质的和规律性的认识,使人们对所研究的资料做出正确的结论。 生物统计学产生于1 9 世纪,它是数理统计与其他应用学科交叉产生的统计科学,涉及生物 学、生态学、医学和金融学等学科领域i ”】。进入2 0 世纪厉,随着1 9 4 6 年第一台电子计算机的发 明,为统计学的发展注入了前所未有的活力。冈为计算机发明的初衷止是要完成复杂、高级和繁 琐的计算。统计学一口与计算机结台起米,统计学就进入了前所朱有的发展新阶段。有了计算机, 中国农业大学顶士学位论文第一章绪论 统计学不再仅仅是艰深的基础理论学科,而是作为研究t 具被广泛地应用到各行各业,成为数量 分析的方法论科学,同时大量的数理方法也得以普及应用。有了计算机,需要更加复杂计算过程 的统计方法就有了产生的可能,统计学也将因此而更加丰富起来。 在生物统计学和计算机技术结合实现统计计算电算化的过程中,经历了如f 几个段q : ( 1 ) 将使用频率较高的常用统计分析方法利用一段程序实现其分析算法,这是基本的统计 计算自动化。 ( 2 ) 随着分散的程序越来越多,开始出现在大型计算机上使用的大型统计软件包。 ( 3 ) 随着微型计算机的出现与发展,微机应用统计软件应运而生,并且随着操作系统高速 的更新换代,统计软件也不断的改头换面,将统计分析与软件开发技术更紧密、更完美的结合, 使得统计软件朝着越来越人性化的方向发展。 ( 4 ) 随着计算机应用领域的高速发展,以数理统计为理论基础的统计分析技术,结台计算 机技术、数据库技术和网络技术所发展起来的譬如数据挖掘技术、联机分析处理技术等高新技术 在各行各业的应用,使得统计分析技术越来越体现其巨大的经济价值,成为人们进行科研分析、 商业决策的重要工具。 如今,生物统计学已成为现代统计发展最重要的研究方向之一,也是目前国际上统计学和生 物信息学最为活跃的研究方向。它以统计模型为基础,以数据为研究对象,应用现代计算机技术 进行统计计算和模拟为特点,着重理论研究与实际应用相结合。 1 2 2 面向生物统计学的统计分析工具的研究现状 由于欧美等发达国家计算机技术起步较早,他们较早地进行了统计分析软件的研制并成功地 推向市场。经过几十年的积累和发展,统计分析软件的功能不断得到改进和加强使用范围也日 益扩大。如今已形成了一批优秀的商业统计分析软件,并在各个行业得到广泛使用。其中以s p s s 、 s a s 、b m d p 为代表的统计分析软件被并称为国际上最有影响的三大统计分析软件”u ”。 ( 1 ) s p s s ( s t a t i s t i c a lp a c k a g ef o r t h es o c i a ls c i e n c e s t a t i s t i c a lp r o d u c ta n ds e r v i c es o l u t i o n s ) 2 0 世纪6 0 年代末,美国斯坦福大学的三位研究生研制开发了妊早的统计分析软件s p s s 同 时成立了s p s s 公司,并于1 9 7 5 年在芝加哥组建了s p s s 总部。2 0 世纪8 0 年代以前,s p s s 统计 软件主要应用于企事业单位。1 9 8 4 年s p s s 总部首先推出了世界第一个统计分析软件微机版本 s p s s p c + ,开创了s p s s 微规系列产品的开发方向,从而确立了个人用户市场第一的地位。同时 s p s s 公司推行本士化策略,目前己推出9 个语种版本。s p s s ,p c + 的推出,极大地扩充了它的应 用范围,使其能很快地应用于自然科学、技术科学、社会科学的各个领域,世界上许多有影响的 报刊杂志纷纷就s p s s 的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高 度的评价与称赞。s p s s 目前已经在国内逐渐流行起来,它使刚w i n d o w s 的窗口方式展示各种管 理羽1 分析数据方法的功能,使j _ ;i 对话框展示山各种功能选挤项,只要掌握一定的w i n d o w s 操作技 能,租通统计分析原理,就可以使_ l 该软件为特定的科研 作服务。 s p s sf o r w i n d o w s 是一个组合式软件包,它集数据挫理、分析功能丁一身。h 户可以根据实 际需要和计算机的功能来选择模块,以降低对系统硬盘容量的要求,有利于该软件的推广应用。 s p s s 的基本功能包括数据管理、统计分析、图表分析、输出管理等等。s p s s 统计分析过科包括 2 中国农业大学硕士学位论文 第一章绪论 描述性统计、均值比较、一般线性模型、相关分析、回师分析、对数线性模型、聚类分析、数据 简化、生存分析、时间序列分析、多重响应等几大类,每类中又分为多个统计过程,比如回归分 析中又分线性回归分析、曲线估计、l o g i s t i c 回归、p r o b i t 同归、加权估计、两阶段最小二乘法、 非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。s p s s 也有专 门的绘图系统,可以根据数据绘制各种图形。 s p s s f o r w i n d o w s 的分析结果清晰、直观、易学易_ i = ,而且可以直接读取e x c e l 及d b f 数 据文件,现己推广到多种各种操作系统的计算机上。和国际上几种统计分析软件比较,它的优越 性更加突出。在众多用户对国际常用统计软件s a s 、b m d p 、g l i m 、g e n s t a t 、e p i l o g 、m i n i t a b 的总体印象分的统计中,其诸项功能均获得最高分。在国际学术界有条不成文的规定,即在国际 学术交流中,凡是用s p s s 软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之 大和信誉之高。 s p s sf o r w i n d o w s 由于其操作简单,已经在我国的社会科学、自然科学的各个领域发挥了巨 大作用。该软件还可以应用于生物学、经济学、心理学、医疗卫生、体育、农业、林业、商业、 金融等各个领域。 ( 2 ) s a s ( s t a t i s t i c a l a n a l y s i ss y s t e m ) s a s 是美国s a s 软件研究所研制的一套大型集成应用软件系统,具有完备的数据存取、数 据管理、数据分析和数据展现功能。由于其具有强大的数据分析能力,因此被广泛应用于政府行 政管理、科研、教育、生产和金融等不同领域,发挥着重要的作用。s a s 系统中提供的主要分析 功能包括统计分析、经济计量分析、时间序列分析、决策分析、财务分析和全面质量管理工具等。 s a s 系统是一个综合软件系统,它由多个功能模块组合而成,其基本部分是b a s es a s 模块。 b a s es a s 模块是s a s 系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用 户语言的处理,调用其他s a s 模块和产品。也就是说,s a s 系统的运行,首先必须启动b a s es a s 模块,它除了本身所具有数据管理、程序设计及描述统计计算功能以外,还是s a s 系统的中央调 度室。它除可单独存在外,也可与其他产品或模块共同构成一个完接的系统。各模块的安装及更 新都可通过其安装程序非常方便地进行。s a s 系统具有灵活的功能扩展接口和强大的功能模块, 在b a s es a s 的基础上,还可以增加如下不同的模块而增加不同的功能:s a s s t a t ( 统计分析 模块) 、s a s g r a p h ( 绘图模块) 、s a s q c ( 质量控制模块) 、s a s e t s ( 经济计量学和时间序 列分析模块) 、s a s o r ( 运筹学模块) 、s a s 1 m l ( 交互式矩阵程序设计语言模块) 、s a s f s p ( 快 速数据处理的交互式菜单系统模块) 、s a s a f ( 交互式全屏幕软件应用系统模块) 等等。s a s 有 一个智能型绘图系统,不仅能绘出各种统计图,还能绘出地图。s a s 提供多个统计过程,每个过 程均含有极丰富的任选项。用户还可以通过对数据集的一连串加工,实现更为复杂的统计分析。 此外,s a s 还提供了各类概率分析函数、分位数函数、样本统计函数和随机数生成函数,使用户 能方便地实现特殊统计要求。 近几年在我国s a s 得到广泛应用,尤其在教育、科研领域,s a s 软件己成为专业研究人员 的实用进行统计分析的标准软件。然而。由于s a s 系统是从大型机上的系统发展而米,其操作至 今仍以编程为主,人机对话界面不太友好,系统地学习和掌握s a s ,需要花费一定的时问和精力。 而对大多数科技t 作者而言,需要掌握的仅是如何利h js a s 来解决白己的实际问题,因此往往会 与s a s 软件失之交臂。 中国农业大学硕士学位论文第一章绪论 ( 3 ) b m d p ( b i o m e d i c a lp r o g r a m s ) b m d p 第一版诞生于1 9 6 1 年,1 9 6 8 年b m d p 公司发行,是展甲的综合专业统计分析软件。 b m d p 在国际上有较大影响,客户达1 万户以上,它方法全面、灵活,早期曾有很多独具特色的 分析方法。但是今非昔比,由于b m d p 发展路途不畅,从1 9 9 1 年的7 0 版以后就没有新版本, 最厉被s p s s 公司收购,而且s p s s 公司在开发与推广8 m d p 统计软件方面的积极性也不大。尽 管如此,b m d p 统计软件作为一方霸主,在国外仍然影响巨人,国外许多大学的统计学网站均对 其关照有加。著名大学统计学系开设的多变量分析课程当中就有b m d p 软件的教学内容,而且大 型学术研究机构的服务器上也通常安装着b m d p f o r u n i x 软件供终端用户使用。 近两年来,随着计算机网络技术、数据库技术的不断发展,以s p s s 和s a s 为代表的统计分 析软件加强了统计分析功能与w e b 应用、数据库系统的整合。2 0 0 4 年4 月s a s 公司在全球同步 发布了其最新的s a s9 软件家族,s a s9 是集成了全新的平台、增强的分析功能和精制的用户界 面的软件。其中商业智能模块中提供了s a s h m r n e t 和s a si t 平台。使用户能通过w e b 来运行特 殊报告和动态应用。2 0 0 5 年s p s s 公司发布了最新版本s p s st 3 0 ,在全面适应互联网、支持动 态收集、分析数据和h t m l 格式报告的基础上,增加了更为强大的输出方式管理和分析结果导出 功能,强化了对w e b 应用的支持。 由此可见,统计分析软件向开发人员提供分析结论的w e b 发布与预订、对组件技术的支持、 以及通过行业标准的系统集成等功能,已经成为未来统计分析软件的一个发展趋势。 1 2 3 软件复用技术的研究现状 软件复用又称软件重用或软件再用,指在两次或多次不同的软件开发过程中重复使用相同或 相似软件元素的过程 6 1 。软件元素包括程序代码、测试用例、设计文档、设计过程、需求分析文 档甚至领域知识。对于新的软件开发项目而言,它们或者是构成整个目标软件系统的部件,或者 在软件开发过程中发挥某种作用。通常将这些软件元素称为软部件,其中在软件复用中对高质量 的软部件又称作资产。 软件复用技术是软件工程发展最新且比较成熟的成果,采用软件复用技术能为软件开发带来 以下几点好处”j : ( 1 ) 提高软件生产率和减少重复劳动。采用软件复用技术大大提高了编码效率,编码的代 码利用率高,且都是经过反复测试的构件成品,加以采用后就可以解决具体的问题。 ( 2 ) 提高软件质量和可靠性。冗余编码在开发周期中所占的比例进一步减少,代码质量大 幅度上升。其中测试是保证质量的直接手段,测试的成效盥接影响到软件的质量。我们利用可复 用的软件测试手段,科学设计测试用例,对于有良好体系结构的采j 复用技术形成的程序、文档 进行测试,大大提高了可靠性。 ( 3 ) 提高软件系统的可维护性。维护在软件生存期中所占的比例晟大,开销也久得惊人。 往往由于维护困难,导致软件的全盘废弃,重新开发新软件。复用率是衡量可维护性的一个重要 指标,f :且这个指标的地位越来越突出。采用复用技术,可以使系统规模相对变小,程序具有高 结构化,模块清晰,可读性强,维护起来就好像计算机硬件的拆装一样,将错误的零忭j = | _ j 某一更 新的构仆替换。方便而有效,维护成本也人人r 降。 中国农业大学顿士学位论文第一章绪论 从技术上划分,软件复用技术主要有库函数,面向对象技术和组件三种i 】j : ( 1 ) 库函数:库函数和源代码级的复用技术产生较早,应用层次较低。很多编程语言为了 增强自身的功能,都提供了大量的库函数。开发人员只要知道函数的名称,返同值的类型,函数 参数和函数功能就可以对其进行调用。 ( 2 ) 面向对象技术;面向对象( o o ,o b j e c t - o r i e n t e d ) 技术通过方法、消息、类和封装等机制 构造软件系统,并为软件复用提供了强有力的支持。在面向对象技术成为当今软件开发的主流技 术的今天,软件复用提高到了一个重要的位置。复用性是面向对象的一个目标,同时,从另一方 面来说,面向对象技术为软件复用提供了更好的手段。它将软件复用的层次从常见的源代码复用、 库函数复用等较为低层次的复用提高到类的复用。 ( 3 ) 软件组件:从抽象程度来看,面向对象技术已达到了类级的复用,它以类为封装的单 位。这样的复用粒度还太小,不足以解决异构互操作和效率更高的复用。软件组件( s o f t w a r e c o m p o n e n o 将抽象的程度提高到一个更高的层次,它是对一组类的组合进行封装,并代表完成一 个或多个功能的特定服务,也为用户提供了多个接口。整个组件隐藏了具体的实现只用接口提 供服务。这样,在不同层次上,组件均可以将底层的多个逻辑组合成高层次上的、粒度更大的新 组件,甚至直接封装到一个系统,是模块的复用从代码级、对象级、架构级到系统级都可能实现 从而使软件像硬件一样,能任意装配定制而成的梦想得以实现。 就组件技术而言,它是在软件复用领域内的一个重要分支。从最初的代码段的复用慢慢的发 展成为一种契约式的交易模式,组件走过了很长一段里程式的发展。随着软件技术的进一步发展。 组件技术将会发挥出更重要的作用。 1 3 课题研究意义 本课题来源于国家9 7 3 重点基础研究发展计划肉仔鸡胃肠道微生物与饲料营养的相互作 用及其对肉品质的调控机理的研究项目。该项目旨在利用现代生物技术、生物统计学和计算机技 术来查明肉仔鸡胃肠道段位不同境生内微生物种类及其随仔鸡生长的演替规律,建立胃肠道微生 物的生物信息库。 由于在以往的试验过程中。不同试验人员将自己所获得的试验数据分别以电子表格形式进行 记载,数据结构繁杂散乱,存在不连贯、不系统且不利于整体查询、汇总等许多问题,不利于对 数据的进一步综合分析,阻碍了对试验数据背后的生物规律的深化挖掘【i ”。尤其在本项目实施过 程中,采用了传统生物检测技术与现代生物检测技术( 如p c r ( 聚合酶链式反应) 技术、蛋白质 凝胶成像技术等) 相结合的方式,所形成的数据数量大,而且数据形式多样( 数字数据,图片数 据等) ,采用简单的电子表格记录每个试验人员的试验数据对厉期数据的综台分析造成很大困难 f | ”。同时,如果使用多种生物信息分析工具软件,必将影响试验数据的连贯性、准确性,并且这 样对研究人员计算机技能及统计知识要求较高,数据处理速度慢、自动化程度低。两此,有效地 建立试验数据库,并集成可靠的统计分析软件,使之成为一个商效有用的整体系统,同时建立科 学的统计分析模型对试验数据进行分析,将对“肉仔鸡胃肠道微生物与饲料营养的相互作用及其 对肉品质的调控机理的研究”具有指导作用,并能辅助该项研究进一步深化。于是建立肠胃道微 生物信息分析系统成为该项目中不可分割的重要组成部分。 5 中国农业大学硕士学位论文 第一章绪论 本课题的目的就是利用面向对象和组件思想,构建一个肉仔鸡胃肠道微生物信息收集、处理、 分析、发布的系统应用框架,_ 并实现系统的开发。该系统具有良好的扩展性、复用性和移植性, 既为研究肉仔鸡胃肠道微生物与饲料营养的相互作用及其对肉品质的调控机理的研究人员提供 了一个良好的生物信息管理与分析平台,同时也为其他生物信息分析系统的开发人员提供了开放 性好、易于复用的组件平台,使软件的复用和快速开发成为可能。 1 4 课题主要研究内容 1 4 1 课题主要研究内容 针对以上存在的问题,我们结合肉仔鸡胃肠道微生物与饲料营养的相互作用及其对肉品质的 调控机理的研究项目的特点及试验数据处理和分析的要求,利用数据库技术、组件技术、w e b 应 用技术和生物统计学理论知识构建了一个界面友好、自动化程度高、使用方便,具备良好的可扩 展性、复用性和易维护性的数据管理与数据分析综合性软件系统。同时建立科学的统计分析模型 对试验数据进行分析,辅助“肉仔鸡胃肠道微生物与饲料营养的相互作用及其对肉品质的调控机 理的研究”项目的进一步深化。 其主要研究内容为: ( 1 ) 在对肉仔鸡胃肠道微生物与饲料营养的相互作用及其对肉品质的调控机理项目调研的基 础上,根据试验设计方案及数据分析、处理要求,综合w e b 应用技术及相关技术构建本软件系统 的应用框架。 ( 2 ) 研究软件的复用和组件开发技术方法,以该项目研究为背景,结合生物统计学理论知识, 选取合适的统计分析模型,利用w e b 应用技术集成s p s s 统计分析软件包,利用组件技术,开发 试验数据准备组件和试验数据分析组件。 在调研和需求分析的基础上,我们设计了一个基于组件的肠胃道微生物信息分析系统 ( g m i a s ,g a s t r o i n t e s t i n a lt r a c tm i c r o b ei n f o r m a t i o na n a l y s es y s t e m ) ,并对其中的技术难点和开 发环节进行了研究和探讨。 1 4 2 论文章节组织形式 论文共分为六章,其组织形式如下: 第一章绪论:主要介绍课题研究背景、国内外研究现状、课题研究的意义以及课题研究的 主要内容。 第二章关键技术:主要介绍了系统中采用的关键技术,包括组件概述、n e t 平台及组件和 s p s s 组件通信技术的介绍。 第三章基于组件的肠胃道微生物信息分析系统的分析与设计:主要介纲了传统的数据处理 方式的缺陷、肉仔鸡肠胃道微生物信息分析系统的设计思想和系统的结构设计。 第四章肉仔鸡肠胃道微生物信息分析系统的实现:主要介鲆 了对系统功能模块的划分和基 丁组件的系统设计。 第五章数据库的设计与实现:主要介绍了数据库设计原则、系统数据库的设计乖f 试验数据 6 中国农业大学硕士学位论文第一章绪论 管理部分e r 模型举例。 第六章论文总结:主要介绍了工作总结和对未来工作的展望。 1 5 本章小结 生物科学技术的迅猛发展和生物数据资源的膨胀,使得生物科学的重点和潜在的突破点已经 由二十世纪的试验分析和数据积累转移到数据分析及其指导下的试验验证上来,生物科学也正在 经历着一个从分析还原思维到系统整合思维的转变。面向生物统计学的统计分析工具目前主要有 三种,分别是s p s s 、s a s 和b m d p 。针对生物统计学的发展现状,结合软件复用技术来构建一 个具备良好的可扩展性、复用性和易维护性的数据管理与数据分析软件系统具有十分重要的意 义。 7 中国农业丈学顶士学位论文第二章关键技术 2 1 组件概述 2 1 1 组件的定义 第二章关键技术 组件是指应用系统中可以明确辨识的、具有一定功能的构成可重用的类模块,每个组件包含 一组属性、事件、方法的组合吼可由单独的组织不定期开发、并且可以被重用,用来构造其它 软件。对应用程序开发人员来说,其内部的信息和运行方式不透明。它提供给客户接口集,客户 通过接口来使用组件。 2 1 2 组件技术的优点 正如绪论中所提到的,软件复用技术提高了软件生产率和减少重复劳动,提高了软件质量和 可靠性,并增强了软件的可维护性。而作为软件复_ j i j 领域内的一个重要分支组件技术而言,基于 组件的应用系统开发有以下特点1 5 j : ( 1 ) 即插即用。组件不用修改代码也不用重新编译就可以方便地集成到系统框架中。使系 统功能的扩充更加容易,大大增强了系统的开放性和可扩充性。 ( 2 ) 以接口为核心。组件的接口和实现是分离的。组件通过接口实现与其他组件和框架的 交互,组件的具体实现被封装在内部,组装者只关心接口,不必知道其实现细节。 ( 3 ) 标准化。组件的接口严格标准化,这是组件技术突出的标志之一。 ( 4 ) 组件资源丰富。市场上有大量成熟的高质量的种类繁多的组件,可供选择的余地很大。 2 1 3 组件技术标准 目前传统的组件技术有m i c r o s o f t 的c o m d c o m ( c o m p o n e n to b j e c tm o d e l d i s t r i b u t e d c o m p o n e n to b j e c tm o d e l 和o m o ( o b j e c tm a n a g e m e n tg r o u p 的c o r b a i i o p ( c o m m o no b j e c t r e q u e s t b r o k e r a r c h i t o c t u r e l ( i n t e r a c t i n t e r a c t i v e o b j e c t p r o t o c o l s ) 承ls u n 公司的r v l l 厄j b ( e n t e r p r i s e j a v ab e a n s ) 三种模型1 2 ,x ,“。 c o r b a 是o m g 组织在1 9 9 1 年提出的公用对象请求代理程序结构的技术规范。c o r b a 的 底层结构是基于面向对象模型的,由o m g 接口描述语言( o m oi n t e r f a c ed e f i n i t i o nl a n g u a g e , o m gi d l ) 、对象请求代理( o b j e c tr e q u e s tb r o k e r ,o e m ) 希li i o p 标准协议( i n t e r n e ti n t e r - o r b p r o t o c o l ,也称网络o r b 交换协议) 3 个关键模块组成。它是开放式的、独立丁厂商、用于网络 上计算机应用豹底层结构。任何厂家、计算机、操作系统、编程语言及网络环境f 的基于c o r b a 的应用均使用i i o p 标准协议,所以任何基于c o r b a 的廊_ h = i 均能协同工作。 s u n 公司r m l ( j a v a r e m o t e m e t h o d i n v o c a t i o n ) 是j a v a 解决分布式应用的最初方案它允许运 行在一个虚拟机上的对象调坍另一台虚拟机上对象的方法,提供了程序间的远程调用的机制。 r m i 允许编写分布式对象,可以使得对象在内存中、跨j a v a 虚拟机和跨物理设备进行通信,其 中国农业大学硕士学位论文 第二- = 章关键技术 最大优势就在于绝对的平台性无关性。j a v a 程序在运行时先通过运行了一个j a 、,a 虚拟机u v m ) 来提供了统一的虚拟环境,所有应用级的j a v a 程序都可以看作是运行在这个虚拟统一的平台上 的,因此它们之间的通信就会特别简单。r m l 的实现主要由以下三层来完成:第一层s t u b 和 s k e l e t o n 的作用是完成客户对远程方法的调用;第二层r e m o t er e f e r e n c e 的作用是解释和管理客 户对远程方法的服务对象,并连接客户调用方法到服务器上运行对虑的远程服务对象;第三层 t r a n s p o r tl a y e r 的作用是完成基于t c p b p 协议计算机网络的连接。在j a v a r m i 的基础上s u n 公 司提出了e i b ( e n t e r p r i s e j a v a b e a n s 卜一基于j a v a 的服务器端组件模型,f j b 框架提供了像远程 访问、安全、持久和生命期管理等多种支持分布对象计算的服务。 c o m d c o m 技术是软件业巨头微软制定的技术规范。由于c o m d c o m 和w i n d o w s 操作系 统的自然结合,使其在对象管理、安全控制方面具有相对较强的优势,几乎所有运行着w i n d o w s 的个人电脑都使用了内建的c o m 支持,并且大多数3 2 位版本的w i n d o w s 还支持d c o m ,所有 的w i n d o w 开发工具都提供相当容易集成c o m 组件的封装包,这也是c o m 技术之所以具有较 强竞争力,并首先在i n t e m e t 上丰富起来的原因之。尤其是安全控制与对象实现相对独立,直 接利用操作系统的安全控制规则,大大简化了开发人员的编程控制工作。这使得在w i n d o w s 环境 下以c o m 为基础的分布式技术在分布式标准中成为一个强有力的竞争者。 n e t 组件技术是微软在2 0 0 0 年推出的一种全新的组件模型,被作为微软f 一代的组件技术。 2 2 n e t 平台及组件 2 2 1 n e t 平台 n e t 框架( n e tf r a m e w o r k ) 一种新的计算平台,它简化了在高度分布式i n t e r a e t 环境中的应 用程序开发。n e tf r a m e w o r k 是用于生成、部署和运行x m lw e bs e r v i c e s 和应用程序的多语 言环境。它由三个主要部分组成:公共语言运行库( c o m m o nl a n g u a g er u n t i m e ,c l r ) 、统一编 程类、a s p n e t 钟。 ( i ) 公共语言运行库 公共语言运行库是n e t 框架的核心,运行库在组件的运行时和开发时操作中都起到很大的 作用。在组件运行时,运行库除了负责满足此组件在其他组件上可能具有的依赖项外,还负责管 理内存分配、启动和停止线程和进程,而且还强制实施严格的类型安全以及可确保安全性和可靠 性的其他形式的代码准确性。 ( 2 ) 统一编程类 n e tf r a m e w o r k 类库是一个与公共语言运行库紧密集成的可重用的类型集合。该类库向程 序员提供所需用来编写在c l r 的控制下运行的代码的软件组件。它们按照单一有序的分级组织 提供了一个庞大的功能集一一从文件系统到对x m l 功能的网络访问的每一样功能。这不但 使n e tf r a m e w o r k 类型易于使j ! j ,而且还减少了学习n e tf r a m e w o r k 的新功能所需要的时 间。此外,第三方组件可与,n e t f r a m e w o r k 中的类无缝集成。 ( 3 ) a s e n e t a s r n e t 建立在n e tf r a m e w o r k 编科类之上,它提供了一个w e b 席用群序模型,包含使 9 中国农业大学硕士学位论文第- 二章关键技术 生成w e b 应用程序变得简单的控件集和结构。a s p n e t 包含封装公共h t m l 用户界面元素( 如 文本框和下拉菜单) 的控件集。但这些控件在w e b 服务器上运行,并以h t m l 的形式将它们 的用户界面推送到浏览器。在服务器上,这些控件公开一个面向对象的编程模型,为w e b 开发 人员提供了面向对象的编程的丰富性。a s e n e t 还提供结构服务( 如会话状态管理和进程回收) , 进一步减少了开发人员必须编写的代码量并提高了应用程序的可靠性。另外,a s p n e t 使用这 些同样的概念使开发人员能够以服务的形式交付软件。使用x m lw e bs e r v i c e s 功能,a s e n e t 开发人员可以编写自己的业务逻辑并使用a s e n e t 结构通过s o a p 交付该服务。 2 2 2 n e t 组件 2 0 0 0 年7 月,微软宣布其。n e t 开发平台使用了一种全新的组件模型口”。n e t 是新的组件技 术革命,作为微软f 一代的组件技术,n e t 框架的目标之一就是改善c o m 的缺陷。c o m 技术 的有些缺陷是与身俱来的( 例如通过套间实现的、难以使用的并发管理) ,也有些缺陷是因为容 易产生错误的开发和部署模式造成的。这方面的例子包括:由引用计数的缺陷导致的内存和资源 泄露、脆弱的注册、需要开发者提供的代理存根对、需要在与代码分离的i d l 文件中定义接口 和类型等等。 设计n e t 的目的不仅是用改善这些缺陷,而且还要维护核心的c o m 思想。与c o m 相 比,n e t 从多角度简化了开发过程。并提供交互性的编程语言。n e t 组件与c o m 组件的开发 不同之处在于1 2 7 1 : ( 1 ) 没有派生出所有组件的正式接口( 例如i u n k n o w n 接口) 。作为替代,所有组件都从 s y s t e m o b j e e t 类派生。因此,所有n e t 对象都是s y s t e m o b j e c t 类的多态表现。 ( 2 ) 没有类工厂。在n e t 中,运行时环境把类型声明或解析成包含该类型的配件以及该配 件内确切的类或结构。 ( 3 ) 没有对象的引用计数。n e t 包含完善的无用单元回收机制,可以检测客户端不再使用 对象的时间,然后无用单元回收器会清除该对象。 ( 4 ) 没有描述接口和定制类型的i d l 文件或类型库。作为替代,那些定义都放在源代码中。 编译器负责使用专用的格式把类型定义嵌入到被称为元数据的配件。 ( 5 ) 没有g u i d 。使用命名空间的配件名称确定类型范围的方法提供了类型( 类域接口) 的 惟一性。在客户端之间共享配件时,该配件必须包含有效名称( s t r o n gn a m e ,一种惟一的二进制 数据使用加密密钥生成) 。虽然全局惟一标识符( g l o b a l l yu n i q u ei d e n t i f i e r s ) 事实上的确还存在, 但是不必再去管理它们。 ( 6 ) 没有套间。默认情况下,所有n e t 组什都在自由线程环境中执行,开发者负责同步组 件的访问。可以依赖n e t 的同步锁或者使用c o m + 的活动米实现同步。 我们所开发的肉仔鸡肠胃道微生物信息分析系统( g m i a s ) 中核心组州擞据准备组件、数据 分析组件平数据库访问组什均采用n e t 组件技术进行开发。 o 中国农业大学硕士学位论文 第二章关键技术 2 3s p s s 组件通信技术 2 3 1 s y n t a x 语言概述 在w i n d o w s 出现之前,s p s s 称为s p s s p c + ,数理统计功能是通过编程来实现的。s p s s p c + 中提供了一种被称为s y n t a x 语言的编程系统,这种语言实际上是一些命令行,执行命令行中的命 令,可以实现各种箨样的功能【”1 。 w i n d o w s 的出现省去了人们使用软件时记忆命令和语法规则的烦恼,直接利用鼠标在友好的 窗口界面上进行选择,并进行简单的输入,便可以完成原来必须借助编程来实现的功能。现在的 s p s sf o r w i n d o w s1 0 x ,1 1 x ,1 2 x 以及最新的1 3 0 版本中依然保留了利用s y n t a x 语言实现数据 处理的方式。目的是使软件开发人员或统计研究人员能通过s p s s f o r w i n d o w s 统计包内部提供的 s a x b a s i c 脚本结合s y n t a x 命令程序进行二次开发。s a x b a s i c 语言类似于w o r d b a s i c ,a c

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论