




已阅读5页,还剩34页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
河 北 工 业 大 学毕业设计说明书 作 者: 学 号: 学 院: 计算机科学与软件学院 系(专业): 软件工程 题 目: 基于PrimerHunter的多重PCR引物 设计系统的构建与应用 指导者: 评阅者: 2015年6月9日河北工业大学2015届本科毕业论文毕业设计(论文)中文摘要基于PrimerHunter的多重PCR引物设计系统的构建与应用摘要:多重PCR技术能够同时扩增多条基因序列,在生物医学中有着重要的应用。PCR实验需要引物来引导这个扩增过程。PrimerHunter是一款多重PCR设计软件,该软件能够高效地设计出具有特异性的多重引物,但是它是在Linux系统下的命令行中才能执行,而且没有考虑引物二聚体的问题。本文中所实现的基于PrimerHunter的多重PCR引物设计系统,是在Ubuntu系统中搭建LAMP架构,将PrimerHunter实现了界面化,由C/S模式转变为B/S模式,同时增加了原软件不具备的引物二聚体检测模块,能够有效检测引物对之间的二聚体情况。生物学者使用该系统能更高效、更便捷地设计出特异性强的多重引物,该系统为相关生物学领域研究提供了一种高效的多重PCR设计工具。关键词:PCR PrimerHunter 多重引物 二聚体检测 B/S模式全套设计加扣 3012250582河北工业大学2015届本科毕业论文毕业设计(论文)外文摘要Title The establishment and application of multiplex PCR primers design system based on PrimerHunter Abstract:Multiple PCR technology can simultaneously amplify multiple gene sequences, and has important applications in biomedicine. The PCR experiment requires primers to guide the amplification process. PrimerHunter is a multiplex PCR design software, the software can efficiently design multiple primers specificity, but it is running in the command line of the Linux system, and it didnt consider the problem of primer dimers. The implementation of the multiplex PCR primers design system based on PrimerHunter in this paper, is in the Ubuntu system with the LAMP architecture, turning PrimerHunter into interface, changing from C/S mode to B/S mode, and increasing the primer dimers detect module which the PrimerHunter dont have, it can effectively detect the dimers between the primer pairs.Biological scholars use this system can design multiplex primer more effective and convenient. It provides an effective tool for the related field of biology to design multiplex PCR primers.Keywords:PCR PrimerHunter multiplex primers dimer detect B/S mode目 录1 引言11.1论文的选题背景11.2 论文研究的意义21.3 论文研究的主要内容21.4 论文的内容安排32 多重PCR技术综述32.1 多重PCR定义32.2 多重PCR技术研究现状52.3 多重PCR过程参数简介63PrimerHunter介绍73.1 PrimerHunter工具73.2 PrimerHunter功能缺陷124 系统总体设计124.1 关键技术解读124.2 系统设计目标及意义164.3 系统功能描述及划分164.4 系统流程图175 系统运行与实现195.1 系统界面展示195.2 系统功能实现216 系统评价286.1 系统特色286.2 系统不足及解决方案296.3 展望29结 论30参 考 文 献31致 谢321 引言基于PrimerHunter的多重PCR引物设计系统,该系统能够高效地设计出具有特异性的多重引物,为生物学的研究提供技术支持。1.1论文的选题背景随着当代计算机技术的迅猛发展,尤其是硬件设备的更新换代以及高性能计算方法,如网格计算、云计算的出现,还有针对大数据的NoSQL数据库以及各种高效存储技术的兴起,使得一些以计算机为工具的交叉学科开始迅猛发展。生物信息学(Bioinformatics)是一门交叉学科,它是由计算机信息处理技术和分子生物学相结合的一门学科,它主要是利用计算机为研究工具来对生物信息进行一系列的操作,如获取、处理、存储、分析、模拟以及解释等。它是当今自然科学和生命科学的重大前沿领域之一,同时它也是21世纪自然科学的核心领域之一。生物信息学的研究内容是利用软件技术和数据库技术对近些年来通过医学实验、临床数据采集等积累的生物大分子序列数据进行处理、比较和分析,从中发现规律,进而能够揭示出生物体大分子的分子结构、分子功能和进化关系以及生物体的基因组构成以及与基因表达等对生命活动的影响。它的研究重点主要体现在基因组学和蛋白质组学两个方面。它是从核酸和蛋白质的序列出发,主要是利用计算机技术来分析这两者的序列中与结构功能有关的生物信息的表达。聚合酶链式反应(Polymerase Chain Reaction,PCR)最早由美国Cetus公司人类遗传研究室Kary Mullis及同事于1985年发现并研制成功的一种在体外扩增DNA的技术,它能够在短时间内根据极微量的模板序列扩增出大量特异性DNA片段,PCR技术是现代分子生物学中最有价值的技术之一。例如:亲子鉴定、人类基因组计划、对罪犯DNA的鉴别,都依赖这一技术。Kary Mullis因发明了“聚合酶链式反应”而获得了1993年诺贝尔化学奖。多重PCR(multiplex PCR),又称多重引物PCR或复合PCR,它是在同一PCR反应体系里加上两对以上引物,同时扩增出多个目标片段的技术,它比单一PCR反应更高效,但是也更有难度。1.2 论文研究的意义在当今医学领域,对致病的病毒类型的快速准确的鉴别在当今人类传染病的诊断方面发挥着重要的作用,尤其是针对疫情爆发和高致病性的传染病如H5N1型禽流感的防治有着极其重要的意义。多重PCR技术主要用于多种病原微生物的同时检测或鉴定某些病原微生物、某些遗传病及癌基因的分型鉴定,可以节省大量的时间、金钱和实验材料,具有巨大的经济和时间效益。PrimerHunter是一款多重PCR设计软件,该软件能够高效地设计出具有特异性的多重引物,但是该软件的操作难度较大,而且该软件没有考虑引物二聚体的问题,针对该软件的优势和缺陷,开发出基于PrimerHunter的多重PCR引物设计系统,则能够更便捷地进行实际多重引物的设计,更好地为生物学的研究提供技术支持。1.3 论文研究的主要内容论文研究的重点是:对已有的PrimerHunter软件包进行研读,对其功能进行修改和完善,使其输出内容符合用户需求,并将该软件功能整合到网页中去,能够在页面中方便用户对各种输入参数进行修改,提交后能够直接运行,将输出结果显示在页面中,同时生成txt文本文件。PrimerHunter软件主要是由C+语言编写而成,它只能够在Linux系统下的命令行窗口中运行,而且有30多个输入参数,输入输出全部都是在命令行下显示,显然,这对于非计算机专业的生物学者来说,操作起来未免太过繁琐,而且容易出错,十分不便。故本论文所实现的系统是网页版,操作简单方便,界面简洁美观,方便用户对各种参数进行修改,符合大多数人的操作习惯。PrimerHunter软件的设计者没有考虑到引物二聚体的情况,引物二聚体就是指设计出的引物之间可能进行一个互补配对而结合到一起,以致不能够发挥引物的作用的一种情况。在该系统中,开发出了检测引物二聚体的模块,能够弥补PrimerHunter这款软件的功能缺失。1.4 论文的内容安排本文共划分为六章,各章具体内容安排如下:第一章 引言。本章主要阐述课题研究的背景和意义,并对主要工作内容作了简略介绍。第二章 PCR技术介绍。本章主要介绍PCR技术的定义,多重PCR技术的研究现状以及PCR的实验参数。第三章 PrimerHunter软件包介绍。本章主要内容包括PrimerHunter软件包的构成、编译及运行,还有其缺陷的介绍。第四章 系统总体设计。本章主要讲解了系统运行所需要的环境,主要是LAMP架构的搭建,阐述了系统的目的及意义,以及对系统功能和系统流程图的描述。第五章 系统运行与实现。本章主要是对实现的系统进行了界面和功能的展示,对系统运行的结果进行分析。第六章 系统评价。本章主要分析了系统特色及目前存在的不足,并提出了应对的解决方案,最后对系统之后的发展做了展望。2 多重PCR技术综述2.1 多重PCR定义聚合酶链式反应(Polymerase Chain Reaction,PCR)是体外扩增DNA的一种技术;它能够在短时间内根据极微量的模板序列扩增出大量特异性DNA片段,扩增过程类似于核裂变,其原理如图2.1所示。图2.1 DNA模板扩增过程在图2-1中,我们可以看到,在聚合酶链式反应中,从一开始的一对模版DNA片段,经过35次循环扩增,就可以扩增出680亿条DNA片段,可以看出其效率之高。在反应中,原始的DNA片段称为模板序列;待复制的DNA片段称为目标序列,它是模板序列的一部分;引导目标序列合成的寡核苷酸片段成为引物,其长度一般在16-27个碱基之间。每个反应一般含20到40个循环,每次循环后,目标序列含量翻一倍;每个循环由三个主要步骤构成:(1) 变性(90-95):双链DNA模板在热作用下,氢键断裂,形成单链DNA。(2) 复性(55-60):系统温度降低,引物与DNA模板结合,形成局部双链;(3) 延伸(70-75):在Taq酶的作用下,以dNTP为原料,从引物的53端延伸,合成与模板互补的DNA链。PCR扩增的过程如图2.2所示。图2.2 PCR扩增过程示意图扩增一段目标序列需要两条引物,分别和目标序列的两端相匹配。PCR引物的作用就好像是电路里的开关,PCR引物如果设计地不好将会导致产物的杂乱无章(即扩增失败),所以PCR引物的成功设计是PCR实验成功的关键之一。引物的设计需要综合考虑引物的退火温度,GC含量,引物长度,特异性等。2.2 多重PCR技术研究现状 多重PCR技术是指在同一个反应试管中加入数对引物的序列,来同时扩增DNA模板中多个区域(即目标序列)的PCR反应。与单引物对的常规PCR反应相比,多重PCR能够明显提高效率,并且节约时间和稀缺的材料,因此在临床检测和环境微生物等的研究中被广泛运用。然而,多重PCR实验成功的关键就在于设计优化引物对组合,尽可能避免由于引物间的交叉组合所产生的非特异性扩增现象出现。 目前,引物设计领域的研究主要集中在单引物的设计优化上,如:Primer3,PrimerPremier,Oligo等,且它们当中也仅有少量引物设计工作考虑到了对非特异性扩增的评估,故它们并不能保证扩增出来的引物的特异性,例如同一种病毒可以有很多种亚型,亚型基因之间的相似度很高,只能靠它们基因中独特的序列来对它们进行鉴别分型,上述的几种工具将病毒的亚型区分出来的能力比较弱。在实际工作中,研究人员往往通过不断反复地做单引物PCR实验来摸索多重PCR实验中的最佳引物组合。而针对这一现状,本系统所采用的PrimerHunter软件的优势就在于为基因序列如病毒亚型等具有类似序列的基因选择出高度敏感和具有特异性的引物。2.3 多重PCR过程参数简介设计多重PCR引物,首先要解决引物评估问题,即回答什么是合适的引物,以及这些引物的相互干扰是否在可接受的范围内。所以,多重PCR引物的设计问题中要充分考虑到的生物学参数分为两大部分:首先要确定的是引物设计的各种约束参数,根据这些约束参数可以用来区分设计出的引物的优劣;其次是要确定引物之间的各种约束参数,根据这些约束参数评价设计出的引物之间的干扰是否在一个可接受的范围内。2.3.1 引物设计的约束参数PrimerHunter对引物设计考虑了如下约束条件:引物长度、引物序列、引物起始位置、引物退火温度、引物GC含量、寡核苷酸长度和GC夹等。(1) 引物长度:引物长度指的是引物上的碱基数目。包括引物的最小长度和最大长度。(2) 引物序列:用户提供的引物序列。若用户提供了引物序列,PrimerHunter将会评估该引物的优劣,并将结果输出出来供用户参考。(3) 引物起始位置:设定所设计的引物在目标序列的起始位置。(4) 引物退火温度:引物与模板序列结合的温度。(5) 引物GC含量:引物中鸟嘌呤(G)和胞嘧啶(C)的百分比。(6) 寡核苷酸长度:引物中相同碱基连续出现的次数。(7) GC夹:引物3端左后几个碱基中含有几个G或C,GC夹可以增加3端的稳定性。2.3.2 引物间的约束参数PrimerHunter对多个引物之间,以及引物对考虑了如下约束条件:引物长度差、退火温度差、发夹结构、产物长度和产物长度差。(1) 引物长度差:它是指引物之间的长度的差,引物设计的目标之一是所有设计出的引物的长度要尽量接近。(2) 退火温度差:它是指引物间退火温度的差,由于所有引物都在同一个试管中发生PCR反应,因此设计出的引物的退火温度应该要尽可能的相似。(3) 发夹结构:发夹结构是经过引物自身互补折叠后形成的结构,在引物设计时要避免这种情况。(4) 产物长度:产物长度指最终产生的产物的长度,一方面,产物序列中应该包含目标序列;另一方面,产物越长成本越高,因此需要限制产物长度。(5) 产物长度差:多重PCR的产物在同一试管中,为了在凝胶电泳中区分不同的产物,需要使产物间有一定的长度差。3 PrimerHunter介绍3.1 PrimerHunter工具PrimerHunter是由Jorge Duitama、Dipu Mohan Kumar、Edward Hemphill等人开发出的一款能够为鉴别病毒亚型的PCR反应设计高敏感度的特异性引物的工具,并在PrimerHunter:a primer design tool for PCR-based virus subtype identification文章中做了介绍。PrimerHunter可以为指定的多条目标序列设计出特异性强的引物,它的一大特色就是它允许用户输入一系列目标序列和非目标序列,而经过PrimerHunter设计出的引物只能够和目标序列进行特异性匹配,而不会和非目标序列匹配,这就保证了引物设计的特异性。3.1.1 软件包构成PrimerHunter主要是由C+语言编写而成的,基本上都是.cpp文件和.h文件。PrimerHunter软件包中包含的文件如图3.1和图3.2所示。图3.1 PrimerHunter-1.0.2文件夹中的文件图3.2 MeltingFracProg文件夹中的文件由上述两图可以看出,PrimerHunter是由C+语言编写而成的,而且只能在Linux系统中的shell命令行窗口中编译执行。3.1.2 PrimerHunter软件编译Linux(本文中的Linux系统版本为ubuntu)环境下的make指令是一个命令工具,它能够解释makefile文件中的指令,PrimerHunter在makefile文件中描述了整个工程的所有文件的编译顺序和编译规则,通俗一点说,就是makefile文件会告诉make指令,你需要做什么,该怎样去做,执行make指令的时候,make就会根据makefile文件中所指示的去执行。当使用make工具进行编译时,工程中以下几种文件在执行make时将会被编译(或重新编译):(1)所有的源文件没有被编译过,则对各个C文件进行编译并进行链接,生成最后的可执行程序;(2)每一个执行make之后修改过的C源代码文件都会在本次执行make指令时重新编译;(3)头文件在上一次执行make之后被修改。则所有包含该头文件的C源文件也会在本次执行make指令时重新编译。在makefile文件中描述了整个工程所有文件的编译顺序和编译规则。在编译时,将会把高级语言所写的代码转换成机器可识别的指令,编译器通过检查高级语言的语法,函数和变量的声明是否正确,如果正确则产生中间目标文件(目标文件在Linux中默认后缀为“.o”)。在链接时,将多个.o文件,或者.o文件和库文件链接成为可被操作系统执行的可执行程序。在PrimerHunter软件包中已经提供了一个makefile的文件,所以,可以直接在命令行窗口中执行make指令,即可生成“.o”文件和相应的可执行文件。图3.3是执行make指令的界面:图3.3 执行make指令图3.4和3.5是make指令执行结束后,编译生成了.o文件。图3.4 make指令执行后PrimerHunter-1.0.2文件夹中的文件图3.5 make指令执行后MeltingFracProg文件夹中的文件3.1.3 PrimerHunter运行通过make指令编译完成后,就可以在命令行中进行运行了。运行时,只能在命令行中输入指令,如果参数需要改变的话,则需要输入参数,否则,PrimerHunter就使用默认参数。图3.6是执行命令的界面:图3.6 PrimerHunter在命令行中执行由图3.6可见,执行一次PrimerHunter,需要输入很多参数,而且很容易出现输入错误,这对于用户操作体验是极差的,所以实现PrimerHunter的界面化是十分必要的。 图3.6代码的运行结果(部分)如图3.7所示:图3.7 PrimerHunter运行结果图PrimerHunter的运行结果直接显示在命令行中,而且有的结果的内容是很长的,这样有可能导致结果内容显示不全,它也不能够自动将结果进行保存,所以对于结果的操作也是很麻烦的,肯定也满足不了用户的需求。所以,构建基于PrimerHunter的多重PCR引物设计系统是很必要的。3.2 PrimerHunter功能缺陷PrimerHunter软件功能本身也有缺陷,它只是考虑了引物自身的发夹结构的检测,而没有考虑到引物之间的二聚体检测,所以它设计出来的引物有可能不能满足实验要求。基于这一缺陷,本系统中通过开发二聚体检测模块,成功弥补了这一不足。在这一模块中,用户可以输入由PrimerHunter设计出来的引物,通过序列的配对检测,可以确定输入的引物之间能否形成二聚体,如果能够形成二聚体,则需淘汰掉,最终用户要选择那些形成不了二聚体的引物作为最终的实验原料,交付生物公司进行生产即可。4 系统总体设计4.1 关键技术解读4.1.1 Ubuntu系统与Windows系统共享文件夹本系统使用的Ubuntu系统的版本号是12.04,是通过VirtualBox虚拟机安装的。为了项目的方便,需要在Ubuntu系统和Windows系统之间共享文件夹,这样在这两个系统之间传递文件或共享数据就会方便很多。实现共享文件夹这一功能并不困难,主要是通过以下3步来实现:(1)安装增强功能包。在VirtualBox的菜单里选择“设备(Devices)”-“安装增强功能(Install Guest Additions)”。(2)设置共享文件夹。安装完增强功能包之后,点击“设备(Devices)”-“分配数据空间(Shared Folders)”,添加一个共享文件夹(我的文件夹名为share)。(3)挂载共享文件夹。在命令行终端下输入:sudo mkdir /mnt/sharedsudo mount t vboxsf share /mnt/shared完成以上操作,就已经实现ubuntu系统和Windows系统的共享文件夹功能了。设置完成后,如图4.1所示。图4.1 Windows与Ubuntu系统共享文件夹示意图 在图4.1中,左侧部分是Windows系统下的文件夹内容,右侧是在ubuntu系统中的文件夹下的内容,从这两个文件夹中的内容可以看到,里面的文件都是相同的,无论是对哪个文件夹进行操作,这两个文件夹的内容变化都是同步的。4.1.2 LAMP平台的搭建LAMP(Linux-Apache-MySQL-PHP)Web网站架构是当下非常流行的一个Web框架,这个框架包括:Linux操作系统、Apache服务器,MySQL数据库,PHP编程语言以及Perl脚本语言,所有组成LAMP框架的产品都是开源软件,LAMP架构是国际上相对成熟的架构框架,很多流行的商业应用都采取这个架构,和Java/J2EE架构相比,LAMP具有很多优点,如Web资源丰富、轻量、快速开发等特点,和微软的.NET架构相比,LAMP架构则具有通用性、跨平台、高性能、低价格的优势,因此LAMP架构无论是从性能、质量还是价格上看,都是搭建网站的首选平台。基于PrimerHunter的多重引物设计系统选择的Linux系统是ubuntu,ubuntu系统是一个以桌面应用为主的Linux操作系统,它的主要特点是简单易用,不需要过多的配置,在标准安装完成后就可以投入使用,十分方便。Apache服务器是世界使用排名第一的Web服务器软件。它几乎可以运行在所有的广泛使用的计算机平台上面,它的跨平台和安全性被广泛使用,它是当下最流行的Web服务器端软件之一。Apache的主要特点就是简单、速度快、性能稳定,并且可以用做代理服务器,用Apache作为网络服务器是负载PHP的最佳选择。PHP是一种通用开源脚本语言。它的语法吸收了C语言、Java语言和Perl语言的特点。它易于学习,使用广泛,功能强大,主要适用于Web开发领域。它可以比CGI或者Perl更加快速地执行动态网页。用PHP做出的动态页面与其他的编程语言做出的页面相比,PHP是采用PHP与HTML代码混编的方式,即将程序嵌入到HTML文档中去执行,执行的效率要比完全生成HTML标记的CGI要高出很多。Perl是一种被称为“拥有各种语言功能的梦幻脚本语言”的开源的免费软件,Perl语言能够在绝大多数的操作系统上运行,也可以方便地向不同系统迁移。Perl语言既强大又好用,它已经被广泛地应用于日常生活的方方面面,从航空航天工程到分子生物学,从数据库操作到网络管理,从数学到语言学,从图像处理到文档处理, Perl语言还可以快速处理那些很难分析或转换的大数据。4.1.3 B/S模式介绍B/S模式即浏览器/服务器模式。这种模式是伴随着Internet技术的兴起,对C/S(客户端/服务器)模式的一种变化或一种改进。在这种模式下,用户的工作界面主要是通过浏览器来实现的,极少部分的事务逻辑是在前端(Browser)实现,而主要的事务逻辑则是在服务器端(Server)实现,形成所谓的三层结构。B/S模式是WEB兴起之后的一种网络结构模式,浏览器是客户端的最主要的应用软件。应用这种模式统一了客户端,将系统功能实现的核心部分都集中到服务器上,这样能够在一定程度上简化了系统的开发、维护和使用。在客户机上只需要安装一个浏览器即可,如Netscape Navigator或Internet Explorer等,服务器则安装Oracle、MySQL或 SQL Server等数据库。浏览器可以通过Web Server同数据库之间进行数据的交互。 这样就能够大大简化了客户端电脑的载荷,减轻了系统维护与升级的成本和工作量,降低了用户的总体成本。3:访问数据2:发送请求1:用户输入客户端数据库服务器应用服务器4:返回结果5:返回响应6:显示B/S模式普遍采用三层体系结构,如图4.2所示。图4.2 B/S三层架构示意图本系统就是将在Linux的shell命令行中执行的模式改为浏览器模式,以这种方式来实现PrimerHunter的功能,一是使用户看不到源代码,防止用户误删文件;二是方便用户操作,提高效率。4.1.4 PHP页面执行shell指令由于PrimerHunter这个软件是在Linux系统下的命令行窗口下通过输入shell指令来执行的,输出也是在命令行窗口中显示的。而用户的需求是通过网页来替代命令行窗口,在页面中进行参数的输入和修改,将输出写入到文本文件中,并能够把输出结果在页面中显示出来。通过对用户需求的分析,要实现上述功能,难点在于通过php对页面中的输入进行处理,来实现shell命令的拼接,并执行shell命令,返回结果。论文中的实现的思路是这样的:按照需求将需要输入的参数都在页面中进行了展示,并且设有默认值,用户也可以根据自己的需要来对默认值进行修改,当修改完所有输入参数时,点击提交,这时,PHP将提交上来的参数进行一个字符串连接操作,将提交上来的各种参数拼接到一起,最终形成shell命令的形式,然后再通过调用system()方法执行拼接好的shell指令即可。4.1.5 输出重定向该系统中,要求将结果输出到文本文件中,并且还要在页面中显示出来,这里,就运用到了Linux中的输出重定向技术,即在指令的最后加一句 1 output/output$id.txt ,这样,运行的结果就直接输出到output文件夹下的output$id.txt文件中了,而将结果显示在页面中就比较容易一点了,就是通过判断文件是否生成,若生成就将文件中的内容读取出来,按一定格式显示就可以了,如果文件不存在,则会提示报错。4.2 系统设计目标及意义本系统设计的目的就是将PrimerHunter软件与Web页面结合起来,对其进行可视化编程处理,并在其基础上进行功能的完善,即添加对引物二聚体的检测功能,展现给用户一个通过页面操作的简单易用的系统。通过设计基于PrimerHunter的多重PCR引物设计系统,能够极大的方便生物医学工作者,使他们能够更快捷、更准确的设计出特异性的多重PCR引物。他们只需要在网页中修改各项参数,而不必在shell命令行状态下一个一个地输入参数,既操作方便,又节省了时间,提高了效率。而且,该系统还增加了对引物二聚体的检测功能,使得PrimerHunter的功能更加完善,使得设计出的引物质量更高。4.3 系统功能描述及划分本系统主要分为两个主要功能模块,一个是PrimerHunter引物设计模块,该模块分为两个模式,分别是引物设计模式和引物调优模式;另一个功能模块是二聚体检测模块,用于检测设计出的引物之间能否形成二聚体。基于PrimerHunter的多重PCR引物设计系统基于PrimerHunter的多重PCR引物设计模块引物二聚体检测模块引物设计模块引物调优模块系统的功能结构图如图4.3所示。图4.3 系统功能结构图在基于PrimerHunter的多重PCR引物设计模块中,分为两个运行模式。在第一种模式下,用户可以提交Target文件和NonTarget文件,Target文件中存放的一般是同一个病毒(如H5N1型高致病性禽流感病毒)的多条基因序列,而NonTarget文件中存放的一般是这个病毒的亚型(如H9N2、H5N2型低致病性禽流感病毒)的多条基因序列。系统能够根据用户提交的这两个文件设计出能够和所有Target文件中的目标序列都能杂交的引物,并且保证设计出的引物没有一条能和NonTarget文件中的序列杂交。在这种模式下,实验中的各种参数可以设置的相对宽松一点,这样可以选择出较多的引物对。在第二种模式下,PrimerHunter会以第一种模式下的结果文件作为输入,用户通过修改实验中的各种参数,制定更为严格的实验条件,来从模式一中筛选出来的引物对中进行更加严格的筛选,也就是对引物对的调优,从而保证了引物对的设计质量。在引物二聚体检测模块中,用户可以选择在引物设计模块中生成的引物对,作为二聚体检测模块的输入,通过匹配算法,对输入的引物序列进行两两匹配,分析它们之间有没有形成二聚体的可能,如果有可能形成二聚体,则还会计算它们之间结合所需要的自由能,自由能越小,则说明引物之间越容易结合成为二聚体,对于这样的情况,则需要摒弃掉。用户最终选择的是不能结合成二聚体的引物对,如果都有可能结合成二聚体,则选择结合自由能最大的引物对。4.4 系统流程图本系统的系统流程主要分为3个分支。第1个分支是进入到引物设计的功能模块,在这一分支中是初步设计出引物。第2个分支是进入到引物调优的功能模块,在这一分支中是对设计出的引物进行调优的过程。当然,如果用户自己自行设计出引物,也可以直接进入到这一分支,对引物直接进行调优。第3个分支是进入到引物之间的二聚体检测的功能模块,在这一分支中是对调优之后的引物之间进行二聚体检测,从而选择出最符合实验条件的引物。用户也可以直接跳过前两个分支,直接进入到这一模块,对自己设计出的引物来进行二聚体的检测。一般情况下,用户应该是先进入到第1个分支,用第一个分支的结果作为第2个分支的输入,再用第2个分支的结果作为第3个分支的输入,最后第3个分支的结果才是最后用户想要得到的,这是本系统的一个完整的流程。但是,存在一些特殊的情况,用户手中有一些阶段性的结果,这样用户就可以直接跳过某一分支,而直接进入到想要进入的分支,这样,就不必从第1个分支开始执行了,只要提供分支所需要的输入就可以直接进行本分支的操作。总而言之,在逻辑上,这3个分支是串行的,需要上一分支的结果作为下一分支的输入,但在结构上,这3个分支则是并行的,用户可以随意进入任一分支进行操作。系统的系统流程图如图4.4所示。开始结束选择功能模块引物设计模块引物调优模块引物二聚体检测模块输入Target文件和NonTarget文件输入引物序列文件输入引物序列返回结果图4.4 系统流程图5 系统运行与实现5.1 系统界面展示系统的主界面如图5.1所示。图5.1 系统主界面从主界面中可以看出,系统有4个标签页,分别是:Home,Design Primers, Detect Dimers,About us。Home是系统的欢迎页面;Design Primers标签页是设计引物模块,包含引物设计和引物调优两个功能模块;Detect Dimers 标签页是引物之间二聚体之间检测的功能模块;About us标签页是关于我们页面。基于PrimerHunter的引物设计模块如图5.2所示。图5.2 PrimerHunter设计引物界面该页面主要是实现对引物的设计,主要的输入文件是TargetFile和NonTargetFile。用户可以在本页面中修改默认的参数,即修改引物的设计要求,如引物的长度范围,GC含量,寡核苷酸的长度等,以及引物发挥作用的实验参数。基于PrimerHunter的引物调优模块如图5.3所示。图5.3 PrimerHunter引物调优模块该页面的输入包括:PrimerFile,引物发挥作用的实验参数。引物二聚体检测模块如图5.4所示。图5.4 二聚体检测界面该页面的输入包括:引物序列,以及引物发挥作用的实验参数。该页面能够检测所输入的引物之间能够形成二聚体,主要通过成功配对的碱基对数和计算出的自由能来判断。5.2 系统功能实现5.2.1 引物设计模块在PrimerHunter的引物设计模块下,分别输入TargetFile和NonTargetFile。其中,TargetFile的内容如下,是一个病毒基因的部分序列:图5.5 TargetFile的内容NonTargetFile的内容如下,是和TargetFile中病毒的基因序列十分相似的一个病毒序列:图5.6 NonTargetFile的内容点击“Design Primers”按钮后,将会将输入的参数传递给处理数据的PHP页面,然后通过PHP将输入的参数通过字符串拼接,形成最终的在命令行中运行的样子,如图5.7所示。图5.7 通过PHP将参数拼接后形成的指令图5-7所示的指令的生成完全是在PHP内部进行的操作,而不需要用户自己去输入这些指令了,只是需要在界面进行简单的参数修改就可以了。指令生成成功后,紧接着就调用PHP中的system()函数,就可以运行如上图所示的拼接好的指令了,其运行结果是生成两个文件,一个是由“output”字符串和“年月日时分秒”拼接形成的文件名命名的文件,这个文件的内容将会在页面中进行显示;另一个是由“primers” 字符串和“年月日时分秒”拼接形成的文件名命名的文件,这个文件将会作为引物调优模块的输入文件。图5.8 引物设计模块生成的结果文件其中,output文件的部分内容如下:图5.9 output文件中的内容从图5.9可以看出,通过一系列PrimerHunter的算法筛选,最终形成了15对引物对,并且将序列都列举出来了,可供用户选择。primers文件中内容如图5.10所示。图5.10 primers文件的内容在primers文件中,主要存储的就是生成的引物的序列,及对前后引物的标记,这个文件的作用是作为引物调优模块的输入。5.2.2 引物调优模块如果在引物设计模块中,结果计算出的引物对的对数如果有很多的话,用户可以再将引物发挥作用的实验参数进一步的严格约束一下,再来选择引物,这就是引物调优模块的作用。现在将上一模块中生成的primers文件作为该模块的输入,并将实验参数中的温差由40摄氏度改为2摄氏度,再点击“Design Primers”按钮,让其生成output文件和primers文件。其中,output文件中的部分内容如图5.11所示。图5.11 引物调优模块output文件的内容由图5.11可见,经过引物调优后,最终生成的引物对的对数变成了12条,相对于引物设计模块的结果减少了3条,即说明对设计出的引物进行了优化,淘汰掉了3条,那用户就可以从剩下的这12对引物对中选择其中的几对,去进行引物之间的二聚体检测,然后选择引物之间不能形成二聚体的引物对,来批量生产,进行多重PCR实验了。5.2.3 引物二聚体检测模块在引物二聚体检测模块下,需要输入的是用户在引物调优模块中设计出的引物对,将引物对的序列按照示例的格式输入到引物二聚体检测页面的文本域中,然后点击“run”来进行引物之间二聚体的检测。图5.12 将引物的序列作为引物二聚体模块的输入为了演示方便,我就选择了4条引物,来进行它们之间的二聚体检测,运行的结果是生成二聚体检测的结果文件并将文件的主要内容显示在页面中,文件中的内容如图5.13所示。图5.13 二聚体检测结果文件的内容(部分)输入的是4条基因序列,系统会让它们进行如下的配对过程:第1条与第1条,第1条与第2条,第1条与第3条,第1条与第4条,第2条与第2条以此类推,故输入4条碱基,一共要进行4+3+2+1=10次的配对比较。从生成的结果文件中可以看出,文件中的主要内容是分三行来进行显示的,能够形成二聚体的引物,系统会把能配对的碱基对数统计出来显示在第一行,把引物之间能配对的部分用竖线连接起来,显示在第二行,最后一行显示的是破坏氢键所需的自由能,自由能绝对值越大,则说明越容易形成二聚体,需要淘汰掉。有经验的生物学者对这种文件是很熟悉的,他们能够根据结果文件中引物的配对的条数以及破坏氢键所需要的自由能的大小来选择合适的引物对。在页面的显示内容如图5.14所示。图5-14 二聚体检测运行结果(部分)在页面中显示的内容与上述的结果文件中的内容类似,只是更为直观的展现给用户,在这里就不多赘述了。5.3.4 小结生物学者通过上述的三个功能模块,就能够设计并选择出符合试验要求的PCR引物,若要实现多重PCR,则只需要多测几个病毒的序列,分别找出其对应的引物,然后再用二聚体检测模块进行检测,选择那些互相之间形成不了二聚体的引物去进行多重PCR实验即可。6 系统评价6.1 系统特色本系统特色主要有以下几方面:(1) 将PrimerHunter软件实现了界面化,完成了从C/S模式到B/S模式的转换,使得用户操作更为方便,用户体验良好。(2) 在PrimerHunter的基础上,增加了引物二聚体检测模块,完善了PrimerHunter的功能。(3) 每个功能模块运行结果都有结果文件生成,方便用户浏览和保存,提高文件的复用率。6.2 系统不足及解决方案截至目前,本系统还存在以下不足之处:(1) 本系统是在Linux下运行的,通过PHP执行shell命令的时候会有权限问题发生,导致结果文件生成不成功。(2) 系统的页面展现出来的不是很美观,有待改进。针对以上问题,拟定解决办法如下:(1) 在第一次运行本系统前,先在命令行下修改对应文件夹的权限,即执行sudo chmod 777 * 指令,这样以后在运行系统后,就能够在相应的文件夹下生成结果文件了。(2) 当初做系统只是重点考虑了功能的实现,对于页面布局以及页面元素的美化没有重点考虑,现在要在本系统功能实现的基础上,对页面布局重新设计,对页面元素进行美化,使其符合用户的审美要求。6.3 展望在计算机技术快速发展的今天,许多领域都迎来了发展的春天,曾经攻克不了的难题,现在都可以用计算机技术来解决了,使得许多学科领域都取得了长足的进步,为人类社会做出了很大的贡献。本系统是计算机技术和生物信息学相结合来解决生物信息学的问题。为了让本系统能够更为便捷有效地为生物信息学领域的学者提供帮助,在今后的改进中,可以考虑把本系统的引物设计功能、引物调优以及引物二聚体检测功能整合成一个模块,用户只需要输入TargetFile和NonTargetFile,提交后就可以生成最后的结果文件,列举出用户所需的引物组合。要实现这一功能,还需要进一步的设计实现,这样就使系统的使用更加的简单便捷了。结 论基于PrimerHunter的多重PCR引物设计系统到现在为止功能已基本实现。虽然这次毕业设计涉及到了很多生物学领域的知识,但是在我的导师和师兄的帮助下,我能够较快速地掌握关于PCR的相关背景知识,把握其关键的实验原理和过程,还有导师给我讲解了PrimerHunter软件包中的源代码,让我能够迅速进入到编程阶段。通过完成基于PrimerHunter的多重PCR引物设计系统,我初步了解生物信息学软件开发的流程,掌握PCR技术在实际中的应用。也很高兴自己能够利用计算机技术为生物学者解决了实际的问题。计算机技术在生物信息学领域还有很广泛的应用前景,我会好好利用自己的专业特长,将计算机技术和生物信息结合起来,解决实际问题,造福社会。参 考 文 献1 Jorge Duitama, Dipu Mohan Kumar, Edward Hemphill等. PrimerHunter: A Primer Design Tool for PCR-Based Virus Subtype identification. Nucleic Acids Res, 37(8):2483-92. doi: 10.1093/nar/gkp073. 2009.2 Huang Y1, Khan MI, Mndoiu. Neuraminidase subtyping of avian influenza viruses with Pr
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高中心态和自律的课件
- 高中化学氯气课件
- 高中光的色散课件
- 高三最后一课课件
- 企业内部知识产权保护与竞业禁止合同范本
- 跨境电商融资合同续签与物流仓储服务协议
- 带有户外景观设计权的二手房买卖合同
- 公寓楼日常保洁托管合同
- 高中地理湘教版(2019)必修2笔记 知识梳理清单
- 如何引导初高中生正确看待追星文化
- 乡镇安全培训课件
- 2025年航空业面试者必看航空公司招聘笔试预测试题及答案
- 2025年全国企业员工全面质量管理知识竞赛题及参考答案
- 2025年秋季开学典礼诗歌朗诵稿:纪念抗战胜利八十周年
- 2025秋仁爱科普版(2024)七年级上册英语教学计划
- 《非物质文化遗产概论(第三版)》全套教学课件
- 2025年信息安全应急演练记录
- 社区医院创建汇报课件
- 适老化家装设计
- 轴对称及其性质第1课时课件2025-2026学年人教版数学+八年级上册
- 第一 单元 富强与创新 单元检测题(含答案)-2025-2026学年 九年级上册道德与法治
评论
0/150
提交评论