(遗传学专业论文)全基因组拷贝数变异数据库的建立及序列特征分析.pdf_第1页
(遗传学专业论文)全基因组拷贝数变异数据库的建立及序列特征分析.pdf_第2页
(遗传学专业论文)全基因组拷贝数变异数据库的建立及序列特征分析.pdf_第3页
(遗传学专业论文)全基因组拷贝数变异数据库的建立及序列特征分析.pdf_第4页
(遗传学专业论文)全基因组拷贝数变异数据库的建立及序列特征分析.pdf_第5页
已阅读5页,还剩74页未读 继续免费阅读

(遗传学专业论文)全基因组拷贝数变异数据库的建立及序列特征分析.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分类号 硕士学位论文 f l i l ll l fi r lr llp i l li i i i y 17 18 4 6 7 密级j 全基因组拷贝数变异数据库的建立 及序列特征分析 d a t a b a s ec o n s t r u c t i o na n d s e q u e n c ef e a t u r e s a n a l y s i so fg e n o m i cc o p yn u m b e rv a r i a t i o n 作者姓名:戴镭 学科专业:遗传学 医学遗传学国家重点实验室 学院( 系、所) :国家生命科学与技术人才培养基地 基因科学与技术产业化点 指导教师:邬玲仟教授 导师小组:梁德生教授 潘乾高级实验师 论文答辩日期主! ! ! :乡v 答辩委员会 中南大学 二0 0 年六月 原创性声明 本人声明,所呈交的学位论文是本人在导师指导下进行的研究 工作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢 的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不 包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我 共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。 作者签名:越擅日期:垄丛生年月上日 学位论文版权使用授权书 本人了解中南大学有关保留、使用学位论文的规定,即:学校 有权保留学位论文并根据国家或湖南省有关部门规定送交学位论文, 允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内 容,可以采用复印、缩印或其它手段保存学位论文。同时授权中国科 学技术信息研究所将本学位论文收录到中国学位论文全文数据库, 并通过网络向社会公众提供信息服务。 作者签名:嘲镭 导师签名衅日期:丝年月上日 硕士学位论文 中文摘要 摘要 目的:l 、建立生长发育迟缓智力障碍全基因组拷贝数变异( c n v ) 数据库2 、分析 拷贝数变异序列特征,对其形成机制进行初步研究。 方法:1 、针对实验室积累的生长发育迟缓智力障碍患者全基因组拷贝数变异数 据,以w i n d o w s + a p a c h e + m y s q l + p h p 为平台开发数据库;2 、通过u c s c 查询 c n v s 断裂点区域序列l c r s s d s 的分布特征,使用r e p e a t m a s k e r 对c n v s 断裂 点区域及5 0 4 个重组冷点对照中s i n e s 、l i n e s 、l t r 等重复元件进行分析检测。 结果:1 、构建了生长发育迟缓智力障碍全基因组拷贝数变异( c n v ) 数据库。该 数据库包括管理员登录系统、数据库查询系统和数据库管理系统。收集了来自 1 6 8 个生长发育迟缓智力障碍患者共8 1 2 个c n v s 数据。2 、在我们所研究的2 9 7 个c n v s 中近端和远端的断裂点区域都富含l c r s s d s 并具有高度的序列相似性 的c n v s 有1 9 个,占6 4 0 ;近端和远端的断裂点区域都富含l c r s s d s 但序 列相似性较低的c n v s 有5 3 个,占1 7 8 5 ;只有一端断裂点区域包含l c r s s d s 的c n v s 有8 0 个,占2 6 9 4 ;在断裂点附近区域没有l c r s s d s 的c n v s 有 1 4 5 个,占4 8 8 1 。对断裂点区域及对照中重复元件的分析结果:a l us i n e s ( 断 裂点区域3 1 4 5 0 4 ,6 2 3 0 ;对照3 3 8 5 0 4 ,6 7 0 6 ) ;m i rs i n e s ( 断裂点区域 1 9 1 5 0 4 ,3 7 9 0 :对照2 0 7 5 0 4 ,4 1 0 7 ) ;l 1l i n e s ( 断裂点区域3 2 8 5 0 4 , 6 5 1 0 ;对照3 4 4 5 0 4 ,6 8 2 5 ) ;l 2l i n e s ( 断裂点区域1 5 5 5 0 4 ,3 0 7 5 ; 对照17 1 5 0 4 ,3 3 9 3 ) ;l 3l 酣e s ( 断裂点区域3 5 5 0 4 ,6 9 4 ;对照3 7 5 0 4 , 7 3 4 ) ;u r ( 断裂点区域2 6 6 5 0 4 ,5 2 7 8 ;对照2 5 3 5 0 4 ,5 0 2 0 ) 。 结论: 1 、构建了生长发育迟缓智力障碍全基因组拷贝数变异( c n v ) 数据库。数据 库输入数据快速、完整、可靠;数据查询快速准确。 2 、在我们所研究的2 9 7 个c n v s 中有1 9 个( 6 4 0 ) 认为是通过n a h r 机 制形成;其他c n v s 的形成与n a h r 机制无关。 硕士学位论文中文摘要 3 、除了微卫星重复产生的染色体不稳定性可能与c n v s 的形成有关,未发 现其他重复元件的存在与基因组不稳定的增加、重组率的提高有明显关联。 4 、舢us i n e s 与l c r s s d s 的形成和扩展有关。a l us i n e s 通过n a h r 机制 产生l c r s s d s ,l c r s s d s 之间通过n a h r 机制产生c n v s ,可能是l c r s s d s 介导c n v s 形成的机制之一。 关键词:拷贝数变异、数据库、w a m p 、l c r s s d s 、r e p e a t m a s k e r 、重复元件 硕士学位论文 英文摘要 a b s t r a c t o b j e c t i v e : 1 t oe s t a b l i s hag e n o m i cc o p yn u m b e rv a r i a t i o nd a t a b a s eo fg r o w t ha n d m e n t a lr e t a r d a t i o n 2 t oa n a l y z et h es e q u e n c ef e a t u r e so fc o p yn u m b e rv a r i a t i o ni n o r d e rt os t u d yt h e i rf o r m a t i o nm e c h a n i s m m e t h o d s : 1 u s i n gw m d o w s + a p a c h e + m y s q l + p h pa sd e v e l o p m e n tp l a t f o r m ,t oe s t a b l i s h t h eg e n o m i cc o p yn u m b e rv a r i a t i o nd a t a b a s eo fg r o w t ha n dm e n t a lr e t a r d a t i o n 2 t oi d e n t i f yt h el c r s s d s d i s t r i b u t i o n a lc h a r a c t e r i s t i c si nb r e a k p o i n tr e g i o n sb yt h e w e b b a s e du c s cg e n o m eb r o w s e r , t oi n v e s t i g a t et h er e p e a ts e q u e n c ee l e m e n t s ( s i n e s ,l i n e s ,u re ta 1 ) i nw h i c ht h e s ec n v so c c u r r e d ,t h es e q u e n c e sf l a n k i n g e a c hb r e a k p o i n t ( 5 k pa te a c he n d ) a n dt h e5 0 4c o n t r o ls e q u e n c e sw e r ea n a l y s e du s i n g r e p e a t m a s k e r r e s u l t s : 1 e s t a b l i s h e dt h eg e n o m i cc o p yn u m b e rv a r i a t i o nd a t a b a s eo fg r o w t ha n d m e n t a lr e t a r d a t i o n t h ed a t a b a s es y s t e mc o n t a i n e da d m i n i s t r a t o rl o g i ns y s t e m , d a t a b a s eq u e r ys y s t e ma n dd a t a b a s em a n a g e m e n ts y s t e m i th a sc o l l e c t e d812c n v s d a t a sf r o m16 8p a t i e n t so fg r o w t ha n dm e n t a lr e t a r d a t i o n 2 o u r2 9 7c n v so f h u m a n 610 - q u a db e a d c h i pc a nb eg r o u p e di n t of o u rc a t e g o r i e s :( 1 ) p r o x i m a la n dd i s t a l b r e a k p o i n tr e g i o n sa r ee n r i c h e df o rl c r sw i t hh i g hs e q u e n c es i m i l a r i t y ( 19 2 9 7 ; 6 4 0 ) ,( 2 ) p r o x i m a la n dd i s t a lb r e a k p o i n tr e g i o n sa l ee n r i c h e df o rl c r s ,b u tw i t h l o ws e q u e n c es i m i l a r i t y ( 5 3 2 9 7 ;17 8 5 ) ,( 3 ) o n l yo n eb r e a k p o i n tr e g i o nh a r b o u r s l c r s ( 8 0 2 9 7 ;2 6 9 4 ) a n d ( 4 ) n ol c rl i e s i nt h ev i c i n i t yo fb o mb r e a k p o i n t s ( 14 5 2 9 7 ;4 8 81 ) t h er e s u l t so f t h er e p e a ts e q u e n c ee l e m e n t si nb r e a k p o i n tr e g i o n s a n dc o n t r o ls e q u e n c e s :a l us i n e s ( b r e a k p o i n tr e g i o n s314 5 0 4 ,6 2 3 0 ;c o n t r o l 3 3 8 5 0 4 ,6 7 0 6 ) ;m i rs i n e s ( b r e a k p o i n tr e g i o n s1 9 1 5 0 4 ,3 7 9 0 ;c o n t r o l2 0 7 5 0 4 , i 硕士学位论文 英文摘要 4 1 0 7 ) ;l 1l i n e s ( b r e a k p o i n tr e g i o n s3 2 8 5 0 4 ,6 5 1 0 ;c o n t r o l3 4 4 5 0 4 ,6 8 2 5 ) ; l 2l i n e s ( b r e a k p o i n tr e g i o n s1 5 5 5 0 4 ,3 0 7 5 ;c o n t r o l1 7 1 5 0 4 ,3 3 9 3 ) ;l 3l i n e s ( b r e a k p o i n tr e g i o n s3 5 5 0 4 ,6 9 4 ;c o n t r o l3 7 5 0 4 ,7 3 4 ) ;l t r ( b r e a k p o i n tr e g i o n s 2 6 6 5 0 4 ,5 2 7 8 ;c o n t r o l2 5 3 5 0 4 ,5 0 2 0 ) c o n c l u s i o n s : 1 e s t a b l i s h e dt h eg e n o m i cc o p yn u m b e rv a r i a t i o nd a t a b a s eo fg r o w t ha n d m e n t a lr e t a r d a t i o n d a t ai n p u tb yu s i n gt h i sd a t a b a s ei sr a p i d ,c o m p l e t ea n dr e l i a b l e d a t aq u e r yi sc o n v e n i e n ta n dc o n v i n c i n g 2 i i l2 4 2 5 o ft h e s ec n v s ,b o t hb r e a k p o i n tr e g i o n sc a r d e dl c r s ,a n di n 2 6 3 9 o ft h e s e ,t h e i rh i 曲d e g r e eo fs e q u e n c es i m i l a r i t yi d e n t i f i e dn a h ra st h e m o s tl i k e l yc a u s eo ft h e s er e a r r a n g e m e n t s l c r sa to n l yo n eo ft h et w ob r e a k p o i n t s , a sd e t e c t e di n8 0 2 9 7 ,a n dn ol c rl i e si nt h ev i c i n i t yo f b o t hb r e a k p o i n t s ,a sd e t e c t e d i n14 5 2 9 7a r eu n l i k e l yt ob ei n v o l v e di nn a h r 3 g e n o m i ci n s t a b i l i t yo fm i c r o s a t e l l i t er e p e a t sm a yb ei n v o l v e di n t h e f o r m a t i o no fc n v s g e n o m i ci n s t a b i l i t yd on o ts h o wa n ys i g n i f i c a n ta s s o c i a t i o n 诹m o t h e rr e p e a a te l e m e n t s m a yb ei n v o l v e di n t h ef o r m a t i o no fl c r s s d s b e e ns u g g e s t e da sap o s s i b l em e c h a n i s mo fc n v w a m p , l c r s s d s ,r e p e a t m a s k e r , r e p e a te l e m e n t s w 硕士学位论文目录 目录 中文摘要i 英文摘要。 第一章前言1 第二章全基因组拷贝数变异( c n v ) 数据库的建立3 2 1 技术背景3 2 2 实验方法1o 2 3 结果与分析1 6 2 4 讨论一2 0 结论。2l 第三章c n v 序列特征分析。2 2 3 1 实验对象2 2 3 2 实验方法2 2 3 3 结果与分析2 8 3 4 讨论3 4 结论。3 7 参考文献3 8 综述4 0 致谢51 个人简历5 2 v 硕士学位论文第一章 第一章前言 基因拷贝数变异( c o p yn u m b e rv a r i a t i o n ,c n v ) 【l j 是指在人类基因组中广 泛存在的,从l k b ( 碱基对) 到m b 范围内的缺失、插入、重复和复杂多位点的变 异。据估计,在基因表达的可遗传变异中基因拷贝数变异至少占1 7 7 ,并且与许 多疾病相关,如孤独症( a u t i s m ) ,肾炎( g l o m e r u l o n e p h r i t i s ) 等。 c n v s 主要通过两个方面的机制影响基因的表达:( 1 ) 直接通过剂量效应改变 特定基因的表达量,造成基因微小缺失或微小复制,引起功能紊乱【2 1 。例如: a n g e l m a n 综合征,d i g e o r g e 综合征,c h a r c o t - m a r i e t o o t h 综合征等。( 2 ) 影响基因 转录调控因子,间接影响基因表达的量1 3 巧】。例如:阻遏子的片段缺失可导致基因 转录活性的增强;启动子及邻近区域的片段重复可导致次稳定重排,降低基因表 达的活性。 c n v s 常发生在同源重复序列或d n a 重复片段之内或之间的区域,通过非 等位基因同源重组( n o n a l l e l i ch o m o l o g o u sr e c o m b i n a t i o n ,n a h r ) 造成染色体 结构重排造成,可引起c n v s 。普遍存在的重复序列能够促进我们基因组的不稳 定和可突变性【6 j ,如低拷贝重复( 1 0 wc o p yr e p e a t s ,l c r s ) 或片段重复( s e g m e n t a l d u p l i c a t i o n s ,s d s ) 。除此之外,反复重复序列的存在,如短分散重复序列( s h o r t i n t e r s p e r s e dn u c l e a re l e m e n t s ,s i n e s ) 和长分散重复序列( 1 0 n gi n t e r s p e r s e dn u c l e a r e l e m e n t s ,l i n e s ) 也能导致基因组的不稳定性和可突变性。n a h r 能够导致较大 的缺失和重复的形成( 或结构变异,如插入) 。然而,不是所有的c n v s 都与这 些重复相关:大约一半已报道的c n v 序列没有与片段重复( s e g m e n t a l d u p l i c a t i o n s , s d s ) 重叠 7 1 。两个最近的研究【8 9 j 提出大部分的c n v s 是由另一 种被称为非同源末端连接( n o n h o m o l o g o u se n dj o i n i n g ,n h e j ) 的机制形成,它 与c n v 断裂点处的微同源性相关而不是长的连续的序列一致性相关。c n v s 的 大小亦和形成机制相关。较之于小片段的c n v s ,大片段的c n v s 与d n a 重复 片段更为密切,非同源突变机制是造成小片段c n v s 的主要原因。 目前全基因组c n v s 的检测方法主要是比较基因组杂交芯片和s n p 芯片法。 比较基因组杂交芯片是指将目的基因和参考基因用不同的荧光进行标记后与芯 片上的d n a 片段进行杂交而产生不同的荧光信号比值,从而得到两者之间拷贝 数的差别【l0 1 。s n p 芯片不需要进行双杂交,只需将目的基因与s n p 芯片杂交得 到杂交信号强度,然后与已知的参考杂交信号对比得出目的基因与参考基因之间 拷贝数的差别1 1 1 , 1 2 j 。 我室自从引进i l l u m i n ab e a d s t a t i o n5 0 0 芯片平台以后,使用h u r n a n s n p 3 7 0 、 硕士学位论文 第一章 h u m a n c y t o s n p 1 2 、h u m a n h a p 5 5 0 、h u m a n 6 1 0 、h u m a n1 m 共5 种芯片对2 0 0 例左右的生长发育迟缓智力障碍患者进行了全基因组拷贝数检测,获得了大量的 c n v s 数据。随着研究的进行和芯片技术的飞速发展,可以预见将有更多c n v s 数据的产生。如何对这些数据进行安全的保存、有效地管理,并在这些c n v s 数据中挖掘出与疾病表型相关的c n v s 、c n v s 形成机制等信息是我们面临的一 项重要任务。 基于以上原因本研究分为两部分:一、针对实验室积累的生长发育迟缓智力 障碍患者全基因组拷贝数变异数据,以w i n d o w s + a p a c h e + m y s q l + p h p 组合为 平台开发生长发育迟缓智力障碍全基因组拷贝数变异( c n v ) 数据库,以对c n v s 数据进行更好的保存和管理:二、利用生物信息学方法分析拷贝数变异的序列特 征,对其形成机制进行初步研究。 2 硕士学位论文第二章 第二章全基因组拷贝数变异( c n v ) 数据库的建立 2 1 技术背景 w a m p 是一个缩写,它指在w i n d o w s 服务器上使用a p a c h e 、m y s q l 和p h p 的集成安装环境:包括w i n d o w s 操作系统、a p a c h e 网络服务器、m y s q l 数据 库和p h p ,p h p 有时候可以用p e r l 或p y t h o n 代替,可以快速安装配置w e b 服务 器。一般说来,大家都习惯于将a p a c h e 、m y s q l 、p 耶架设在l i n u x 系统下。 l i n u x 是开放系统,但是,不可否认的是w i n d o w s 也有其优点,就是易用,界面 友好,软件丰富,操作起来非常方面,因此对新手来说在w i n d o w s 平台下使用 a p a c h e 、m y s q l 、p h p 也确实是一个不错的选择。a p a c h e 是最通用的网络服务 器;m y s q l 是带有基于网络管理附加工具的关系数据库;p h p 是流行的对象脚 本语言,它包含了多数其它语言的优秀特征来使得它的网络开发更加有效。 2 1 1 常见的w a m p 集成环境 w a m p 5 1 3 lw a m p 5 是一款优秀的w a m p 集成软件,可以轻松的一下 子同时安装好p h p 5 + m y s q l + a p a c h e 环境,通过安装w a m p 5 ,可以在计算机上 迅速建立w a m p 的服务器环境,非常方便网络相关人员进行w i k i 、b b s 等程序 的使用学习与本地调试,同时,w a m p 5 软件包内还集成了p h p m y a d m i n 和 s q l i t e m a n a g e r 管理工具,更加方便使用。w a m p 5 不支持w i n 9 8 和w i n n l e ,因 为上述平台无法执行w a m p 所需要的w i n d o w s 服务,在w r 四、w i n 2 0 0 0 、 w i n 2 0 0 3 下运行良好。 w l i l l p s e n ,e r w a m p s e r v e r 是一款开软的,建设在本地的p h p 套件,安 装这个套件之后,就在本地模拟了一套p 肿环境,我们就可以在本地安装并使 用w o r d p r e s s 了,w a m p s e r v e r 默认的除了不支持伪静态之外,其他的功能和专 业主机并没有差别。 a p p s e 一a p p s e r v 是p 唧网页架站工具组合包,作者将一些网络上免 费的架站资源重新包装成单一的安装程序,以方便初学者快速完成架站,a p p s e r v 所包含的软件有:a p a c h e 、a p a c h em o n i t o r 、p h p 、m y s q l 、p h p m y a d m i n 等。 如果您的本地机器没有安装过p h p 、m y s q l 等系统,那么用这个软件则可以让你 迅速搭建完整的底层环境。 洲p p 一一x a m p p 是一个易于安装且包含m y s q l 、p h p 和p e r l 的 硕士学位论文 第二章 a p a c h e 发行版。x a m p p 的确非常容易安装和使用:只需下载,解压缩,启动 即可。适用于w m d o w s9 8 、n t 、2 0 0 0 、x p 和v i s t a 的发行版本包括:a p a c h e 、 m y s q l 、p h p + p e a r p e d ,m o d _ _ p h p ,m o d _ p e r l ,m o d _ s s l ,o p e n s s l ,p h p m y a d m i n , w e b a l i z e r , m e r c u r ym a i lt r a n s p o r ts y s t e m ,m i n g ,j p g r a p h , f i l e z i l l af t ps e r v e r m e r y p t , e a c c e l e r a t o r , s q l i t e 和w e b - d a v + m o d _ a u t h _ m y s q l 。 a p m s e r v 一一a p m s e r v 是一款快速搭建a p a c h e 2 2 x 、p h p 5 2 x 、 m y s q l 5 1 x 4 o 2 6 、n g i n x 、m e m c a c h e d 、p h p m y a d m i n 、o p e n s s l 、s q l i t e 、 z e n d o p t i m i z e r ,以及a s p 、c g i 、p e d 网站服务器平台的绿色软件,并拥有跟i i s 一样便捷的图形管理界面。 2 1 2w i n d o w s 简介 w i n d o w s 是m i c r o s o f t 公司在2 0 世纪8 0 年代末推出的多任务图形化操作系 统。由于它易于使用、速度快、集成娱乐功能、方便快速上网,现已深受全球众 多电脑用户的青睐。短短十几年中,w i n d o w s 由原来的w i n d o w s l 0 版本到去年 正式发布的w i n d o w s7 , w m d o w s 的功能已日渐丰富,发展势头迅猛,越来越多的 计算机都安装上了w m d o w s 操作系统。 2 1 2 1w i n d o w s 的特点 w i n d o w s 是一个多任务图形用户界面,该环境可以在基于m s d o s 的计算机 上运行,在多任务图形用户环境下,w i n d o w s 提供了一个基于下拉菜单、屏幕窗 口和鼠标的界面,在该环境下运行的应用程序必须进行专门的设计才能发挥这些 特征的优点。 w i n d o w s 能够充分发挥计算机的作用,其图形接口能够组织用户程序和文 件、同时运行几个用户程序、在文档之间移动和复制信息、在平台上进行应用程 序的切换等。为了提高效率,w m d o w s 还提供了一些辅助程序,如字处理器、画 笔及其他标准应用程序等。 w m d o w s 具有以下主要特点【1 4 】: 1 ) 图形化的用户界面 w i n d o w s 提供了一种不同于d o s 系统下命令行的工作方式,它通过对 窗口、图标、选单、对话框、命令按钮、滚动框等图形符号与画面的操作来 实现对计算机的各种操作。 2 ) 标准化的操作界面 4 硕士学位论文 第二章 在w i n d o w s 中,所有的操作都是通过窗口中的图形界面进行的。 3 ) 充分利用内存 w i n d d w s 利用虚拟内存技术,允许应用程序超过6 4 0 阳常规内存的运行 空间,从而最大限度地利用了计算机系统的所有内存资源,从而使内存较小 的微机也能运行大型的应用程序。 4 ) 多任务机制和执行性能 在w i n d o w s 中,平稳的多任务机制可以同时运行多道程序以及执行多项 任务,各程序与各任务之间不仅转换容易,而且还可以方便地交换数据。 5 ) 丰富的多媒体功能 w i n d o w s 提供大量辅助程序,用以实现文字、图形、图像、声音、视频 等多媒体功能,同时还支持其他厂商基于w i n d o w s 标准开发的各种相应软 件。 6 ) 强大的联网功能 在w m d o w s 中,可以简单直观地实现网络的安装、配置、浏览,从而可 以更加方便地实现网络管理和资源共享。 7 ) t r y t y p e 技术 t r y t y p e ( 真实字体) 属于内建式比例字体,可以任意平滑放大与缩小。这 种字体能使屏幕上显示的效果与实际打印机输出的信息完全一致,这就是所 谓的“所见即所得 2 1 3a p a c h e 简介 a p a c h eh t t ps e r v e r ( 简称a p a c h e ) 是a p a c h e 软件基金会的一个开放源码 的网页服务器,可以在大多数计算机操作系统中运行,由于其跨平台和安全性被 广泛使用,是最流行的w e b 服务器端软件之一。它快速、可靠并且可通过简单 的a p i 扩充,将p e r l p y t h o n 等解释器编译到服务器中。 a p a c h e 起初由伊利诺伊大学香槟分校的国家超级计算机应用中心( n c s a ) 开发。此后,a p a c h eh t t p d 被开放源代码团体的成员不断的发展和加强。a p a c h e h 婶网站服务器拥有牢靠可信的美誉,已经在全球超过半数的网站中被使用一特 别是几乎所有最热门和浏览量最大的网站。 a p a c h e 是世界排名第一的w e b 服务器,根据n e t c r a f t ( w w w n e t s r a f t c o u k ) 所作 的调查,世界上百分之五十以上的w e b 服务器在使用a p a c h e 1 9 9 5 年4 月,最早的 a p a c h e ( 0 6 2 版) 由a p a c h eg r o u p 公布发行a p a c h eg r o u p 是一个完全通过i n t e r n e t 进行运作的非盈利机构,由它来决定a p a c h ew e b 服务器的标准发行版中应该包 硕士学位论文 第二章 含哪些内容准许任何人修改隐错,提供新的特征和将它移植到新的平台上,以 及其它的工作当新的代码被提交给a p a c h eg r o u p 时,该团体审核它的具体内容, 进行测试,如果认为满意,该代码就会被集成到a p a c h e 的主要发行版中 2 1 3 1a p a c h e 的特性 a p a c h e 支持许多特性,大部分通过编译的模块实现。这些特性从服务器端的 编程语言支持到身份认证方案。一些通用的语言接口支持p e r l ,p y t h o n ,t c l 和 p h p 。流行的认证模块包括r o o d _ a c c e s s ,m o d a u t h 和m o d _ d i g e s t 。其他的例子有 s s l 和t l s 支持( m o ds s l ) ,代理服务器( p r o x y ) 模块,很有用的u r l 重写( 由 m o d r e w r i t e 实现) ,定制日志文件( m o d _ l o g _ c o n f i g ) ,以及过滤支持( m o d _ i n c l u d e 和m o de x tf i l t e r ) 。a p a c h e 日志可以通过网页浏览器使用免费的脚本a w s t a t s 或v i s i t o r s 来进行分析。 其特性【1 5 】分列如下: 1 ) 几乎可以运行在所有的计算机平台上 2 ) 支持最新的h t t p 1 1 协议 3 ) 支持虚拟主机 4 ) 支持h t t p 认证 5 ) 简单而且强有力的基于文件的配置( h t t p d c o i 岣 6 ) 支持通用网关接e l ( c g i ) 7 ) 集成p e d 8 ) 集成的代理服务器 9 ) 支持安全s o c k e t 层( s s l ) 1 0 ) 具有用户会话过程的跟踪能力 1 1 ) 支持f a s t c g i 12 ) 支持j a v as e r v l e t s 1 3 ) 可以通过w e b 浏览器监视服务器的状态,可以自定义日志 1 4 ) 支持服务器端包含命令( s s i ) 2 1 4m y s q l 简介 m y s q l 是目前最为流行的开放源代码的数据库,是完全网络化的跨平台的 关系型数据库系统,它是由瑞典的m y s q l a b 公司开发、发布并支持的,于1 9 9 5 年建立。它的象征符号是一只名为s a k i l a 的海豚,代表着m y s q l 数据库和社团 6 硕士学位论文 第二章 的速度、能力、精神和优秀品质。在2 0 0 8 年1 月1 6 号被s u n 公司收购。 目前m y s q l 被广泛地应用在i n t e m e t 上的中小型网站中。由于其体积小、 速度快、总体拥有成本低,尤其是开放源码这一特点,很多公司向开放源代码的 数据库系统迁移,从而降低花费成本。 m y s q l 可以称得上是目前运行速度最快的s q l 语言数据库。除了具有许多 其它数据库所不具备的功能和选择外,m y s q l 数据库是一种完全免费的产品, 用户可以直接从网上下载数据库,用于个人或商业用途,而不必支付任何费用。 2 1 4 1m y s q l 的特性1 1 6 i 1 ) 使用c 和c h 编写,并使用了多种编译器进行测试,保证源代码的可移 植性 2 ) 支持a i x 、f r e e b s d 、h p - u x 、l i n u x 、m a co s 、n o v e l ln e t w a r e 、o p e n b s d 、 o s 2w r a p 、s o l a r i s 、w i n d o w s 等多种操作系统 3 ) 既能够作为一个单独的应用程序应用在客户端服务器网络环境中,也能 够作为一个库而嵌入到其他的软件中提供多语言支持,常见的编码如中 文的g b2 3 1 2 、b i g 5 ,日文的s h i f tj i s 等都可以用作数据表名和数据列 名 4 ) 为多种编程语言提供了a p i 。这些编程语言包括c 、c + + 、e i f f e l 、j a v a 、 p e r l 、p 肿、p y t h o n 、r u b y 和t e l 等。 5 ) 支持多线程,充分利用c p u 资源 6 ) 优化的s q l 查询算法,有效地提高查询速度 7 ) 提供t c p i p 、o d b c 和j d b c 等多种数据库连接途径 8 ) 提供用于管理、检查、优化数据库操作的管理工具 9 ) 可以处理拥有上千万条记录的大型数据库 2 1 5p h p 简介 p 肿u 刀,是英文超级文本预处理语言h y p e r t e x tp r e p r o c e s s o r 的缩写。p h p 是 一种h t m l 内嵌式的语言,是一种在服务器端执行的嵌入h t m l 文档的脚本 语言,语言的风格有类似于c 语言,被广泛的运用。 2 1 5 1p h p 的发展历史1 1 8 l 7 硕士学位论文第二章 p h p 原本的简称为p e r s o n a lh o m ep a g e ,是r a s m u sl e r d o r f 为了要维护个人 网页,而用c 语言开发的一些c g i 工具程序集,来取代原先使用的p e r l 程序。 最初这些工具程序用来显示r a s m u sl e r d o f f 的个人履历,以及统计网页流量。 他将这些程序和一些表单直译器整合起来,称为p h p f i 。p h p f i 可以和数据库 连接,产生简单的动态网页程序。r a s m u sl e r d o f f 在1 9 9 5 年6 月8 日将p h p f i 公开释出,希望可以透过社群来加速程序开发与寻找错误。这个释出的版本命名 为p h p2 ,已经有今日p h p 的一些雏型,像是类似p e r l 的变量命名方式、表 单处理功能、以及嵌入到h t m l 中执行的能力。程序语法上也类似p e r l ,有较 多的限制,不过更简单、更有弹性。 在1 9 9 7 年,任职于t e c h n i o nl i t 公司的两个以色列程序设计i ) z e e vs u r a s l d 和a n d ig u t m a n s ,重写了p h p 的剖析器,成为p h p3 的基础,而p h p 也在 这个时候改称为p h p :h y p e r t e x tp r e p r o c e s s o r 。经过几个月测试,开发团队在1 9 9 7 年1 1 月释出了p h p f i2 ,随后就开始p h p3 的开放测试,最后在1 9 9 8 年6 月 正式释出p h p3 。z e e vs u r a s k i 和a n d ig u t m a n s 在p h p3 释出后开始改写 p h p 的核心,这个在1 9 9 9 年释出的剖析器称为z e n de n g i n e ,他们也在以色列 的r a m a tg a n 成立了z e n dt e c h n o l o g i e s 来管理p h p 的开发。 在2 0 0 0 年5 月2 2 日,以z e n de n g i n e1 o 为基础的p h p4 正式释出,2 0 0 4 年7 月1 3 日则释出了p h p5 ,p 唧5 则使用了第二代的z e n de n g i n e 。p h p 包含 了许多新特色,像是强化的面向对象功能、引入p d o ( p h pd a t ao b j e c t s ,一个 存取数据库的延伸函数库) 、以及许多效能上的增强。目前p h p4 已经不会继续 更新,以鼓励用户转移到p h p5 。 现在最新的p h p 版本为p 肿5 3 ,加入了延迟静态绑定( l a t es t a t i cb i n d i n g ) 、 支持命名空间、使用x m l r e a d e r 和啊t e r 增强x m l 支持、支持s o a p 。 p h p6 的开发正在进行中,主要的改进有移除r e g i s t e r _ g l o b a l s 、m a g i cq u o t e s 和 s a f em o d e 的功能,去除r e g i s t e rl o n g,并支持 。array u n i c o d e 2 1 5 2p h p 的特性1 1 7 1 1 ) 开放的源代码:所有的p 唧源代码事实上都可以得到。 2 1p h p 是免费的。 3 ) p h p 的便捷性:p h p 十分便捷,学习简单 4 ) 简单的语言:p h p 坚持脚本语言为主,与j a v a 和c + + 不同。 5 ) 效率高:p 肿消耗相当少的系统资源。 6 ) 图像处理:用p h p 动态创建图像 8 硕士学位论文 第二章 7 ) 基于服务器端:由于p h p 是运行在服务器端的脚本,可以运行在u n i x 、 l i n u x 、w i n d o w s 下。 8 ) 嵌入h t m l :因为p h p 可以嵌入h t m l 语言,所以学习起来并不困难。 9 ) 面向对像:在p h p 4 、p h p 5 中,面向对象方面都有了很大的改进,现在 p h p 完全可以用来开发大型商业程序。 1 0 ) p h p 相对于其他语言,编辑简单,实用性强,更适合初学者

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论