HIV全基因组分析_第1页
HIV全基因组分析_第2页
HIV全基因组分析_第3页
HIV全基因组分析_第4页
HIV全基因组分析_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、HIV I全基因组分析HIV(human immunodeficiency virus)俗称艾滋病毒(AIDS)是逆转录病毒的一类,引起人类获得性免疫缺损综合症,长9.18kb。已发现的HIV有两种:HIV I和HIVII. HIV I从欧洲和美洲分 离的毒株,致病力强,是引起全球艾滋病流行的主要病原;HIV II毒力 较弱主要局限于西部非洲。一、资料:通过NCBI下载HIVI的全基因组序列,序列信息 如下:LOCUSNC_0018029181 bp ss-RNA linear VRL08-DEC-2008DEFINITIONHuman immunodeficiency virus 1, co

2、mplete genome.ACCESSIONVERSIONNC_001802NC_001802.1 GI:9629357DBLINKKEYWORDSProject:15476SOURCE Human immunodeficiency virus 1 (HIV-1)ORGANISM Human immunodeficiency virus 1 Viruses; Retro-transcribing viruses; Retroviridae;Orthoretrovirinae; Lentivirus; Primate lentivirus group.二、序列分析:1. 基因结构及特点HIV-

3、1 的基因列顺序为:LTR-gag-pol-vif-vpu-vpr-tat-rev-env-nef-LTR(如 图.1)图 1 HIV 基因结构两端是长末端重复序列( long terminal repeats, LTR ),含顺 式调控序列,控制前病毒的表达。已证明在 LTR 有启动子和增强 子并含负调控区。LTR之间的序列编码了至少9个蛋白,可分为 三类:结构蛋白、调控蛋白、辅助蛋白。(1)gag基因:长约1536个核苷酸,编码合成约55KD非糖基化 的多聚蛋白前体(p55),随后被pol基因编码的一种病毒蛋白水解 酶裂解,加工为基质蛋白p17、衣壳蛋白p24及核衣壳蛋白(NC)。(2)p

4、ol基因:长约3045个核苷酸,编码合成160kD的gag-pol 前体蛋白,从N端至C端分别产生蛋白酶(PR)、逆转录酶(RT)、 核糖核酸酶H及整合酶。作用是参与多种蛋白的水解与合成,促进 病毒整合入宿主细胞基因。pol基因是逆转录病毒中最保守的基因。(3)env基因:长约2589个核苷酸,主要编码约826个氨基酸的 包膜前体蛋白,在病毒包膜成熟过程中,前体蛋白gp160经过剪切 而成外膜糖蛋白gp120和跨膜糖蛋白gp41。Gp41与gp120以非共价 键形式相互结合,跨膜区的功能是促使毒粒穿入细胞。tat基因:表达激活蛋白,是HIV两种重要的调节因子之一, 以两种形式存在,编码72aa

5、的tat-1基因和编码86aa的tat-2基因(占 大多数)。tat蛋白主要位于核内,激活转录的起始并促进转录物的 延长。(5)rev基因:是HIV第2种必需的调节因子,编码一种96kD的 磷蛋白,主要定位于核内,rev结合于RRE,促使病毒转录出各种 mRNA,由细胞核进入胞浆,并使其保持稳定。rev被认为是慢病毒 最保守的调节基因。vif基因:也称病毒感染因子,编码23kD蛋白,增强病毒的 感染性,但不能提高病毒颗粒产量。最近研究表明vif蛋白主要的功 能是调节病毒复制、组装、出芽,成熟的vif蛋白可以特异性地与蛋 白酶相互作用。vpr基因:编码产物为病毒蛋白R,与p55 Gag蛋白前体中

6、的 p6相互作用。Vpr蛋白主要存在于核内或质膜上,作为核定位信号,介导未整合的原病毒复合物进入细胞核,抑制细胞生长反式作 用于HIV-1LTR结构中的启动子和细胞基因的启动子,激活细胞基因 的表达,还可以诱导细胞的分化。与vpx基因具有较高的同源性。vpu基因:是HIV-1特有的。Vpu蛋白由81aa组成,分子量 为16kD,是一种整合膜蛋白,不存在于病毒粒子中。Vpu生物学功 能至少有两种:介导内质网中CD4降解和促进病毒粒子从被感染细 胞的质膜上释放。Vpu蛋白还涉及到env的装配,增强HIV-1感染细 胞对FAS因子的敏感性。nef基因:编码多功能nef蛋白,分子量约27kD,是一种负

7、调 控蛋白,依靠十四烷基残基保守区上的第2位氨基酸定位于宿主细 胞膜内面,是病毒增殖的早期基因产物,也是病毒感染细胞后产生 的第一种蛋白。是HIV所有辅助蛋白中免疫原性最强的。Nef可以下 调CD4细胞和MHC-I分子;可以增强病毒的感染性,参与病毒和细 胞转录的负调控,通过抑制病毒LTR的功能,干扰病毒的基因转 录。HIVI基因组比较小,是由连续的核糖核苷酸构成。此外从 HIVI 基因的结构图中可以看出,HIVI中存在重叠基因,这样种结构使 像它这样的较小的病毒基因组能够携带较多的遗传信息。重叠既有 完全重叠也有部分重叠。HIV I编码区域也与一般病毒基因组的特 点相似,编码区段站整个基因组

8、的 93%。2.碱基特点分析HIV I全基因组的GC含量占42%;CG24%TA四种核苷酸出现的频率如图2.1:CG24%TA四种核苷酸出现的频率如图2.1:图2.1四种碱基出现的频率(1)G/C含量的差异采用200bp的窗口大小,以20bp的大小从5端向3端滑动,计 算G-C/G+C。最后以基因组相对位置为横坐标,G-C/G+C的值为纵 坐标作图。如图2.2。 图2.3G-C/G+C累加。图2.2 G-C/G+C分值图SOAccumulation of G-C/G+C604020-i -in .dll Fin w1 0图2.2 G-C/G+C分值图SOAccumulation of G-C/

9、G+C604020-i -in .dll Fin w1 0图2.2 G-C/G+C累加值图与原核生物基因组中的G与C含量的偏差的变化不同,原核生物的 复制起点处G-C累加值达到最低,在终点处又增大到最大。而 HIV I病毒基因组中大部分片段处G的含量高于C的含量。(2)核苷酸的关联度分析进一步的统计分析可以发现,在HIVI基因组中,两个连续核 苷酸出现的频率也是不相同的。4种核苷酸可以组合成16种两联核 苷酸。为了计算每个核苷酸对(i,j)的出现频率,扫描整个基因组 DNA序列,累计核苷酸j在核苷酸i之后出现的次数,再除以总核苷 酸对的数目。在单条DNA序列上,总核苷酸对的数目等于序列的长 度

10、减1。对HIV基因组两联核苷酸的统计结果见下表,其中,核苷酸 对出现频率最高的达到21%,而出现频率最低的只有2%。如下表2 所示:表2核昔酸对的统计Pattern:Times Found:Percentage:Pattern:Times Found:Percentage:GG48811GA76917GT4069GC4259AG97121AA81118AT69015AC52411三、密码子偏好性分析:Pattern:Times Found:Percentage:TG54612TA66214TT4069TC3157CG822CA75416CT4279CC3077对HIV I基因组的密码子偏好性进

11、行了统计如下:PheUUU511.44SerUCU310.70TyrUAU390.95CysUGU521.12UUC200.56UCC300.68UAC431.05UGC410.88LeuUUA290.85UCA410.93TERUAA941.17TERUGA690.86UUG441.29UCG60.14UAG790.98TrpUGG591.00CUU401.18ProCCU341.31HisCAU551.01ArgCGU20.04CUC200.59CCC301.15CAC540.99CGC30.07CUA341.00CCA351.35GlnCAA590.77CGA110.25CUG371.0

12、9CCG50.19CAG941.23CGG80.18IleAUU661.22ThrACU471.01AsnAAU901.29SerAGU841.91AUC400.74ACC460.98AAC490.71AGC721.64AUA561.04ACA901.93LysAAA1351.21ArgAGA1403.12MetAUG411.00ACG40.09AAG890.79AGG1052.34ValGUU291.18AlaGCU371.10AspGAU501.00GlyGGU310.63GUC80.33GCC371.10GAC501.00GGC440.89GUA281.14GCA521.55GluGAA

13、671.06GGA711.43GUG331.35GCG80.24GAG600.94GGG521.05四、同源性分析通过在线BLAST搜索发现以下几个基因组与HIV I同源性非常高,它们都是HIV病毒的不同亚型:gblAF070521.1IAF070521 HIV-1 E9 from the USA, complete genome Length=9699emb|Z11530.1i Human Immunodeficiency virus I (HIV-1) RNAgb|U26942.11HTV1U26942 Human immunodeficiency virus clone pNL4-3, subclone 4.20gb|M1992L1HIVNL43 Human immunodeficiency virus type 1, NY5/BRU (LAV-1) recombinantgb|AF324493.1|AF324493 HIV-1 vector pNL4-3, complete sequencegb|EU541617.1|

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论