生物工程专业 口蹄疫病毒基因组密码子使用偏好性及其进化分析研究_第1页
生物工程专业 口蹄疫病毒基因组密码子使用偏好性及其进化分析研究_第2页
生物工程专业 口蹄疫病毒基因组密码子使用偏好性及其进化分析研究_第3页
生物工程专业 口蹄疫病毒基因组密码子使用偏好性及其进化分析研究_第4页
生物工程专业 口蹄疫病毒基因组密码子使用偏好性及其进化分析研究_第5页
免费预览已结束,剩余24页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、口蹄疫病毒基因组密码子使用偏好性及其进化 摘 要:分析了 FMDV 基因编码起始区与终止区的密码子使用偏好性。 实验主要选择了FMDV中最具代表性以及感染率最高的O型与A型进行密码子偏好性的分析以及进化方向的讨论。通过实验的数据可以得到初步的结论:在O血清型与A血清型的基因群落当中,并不存在固定同义密码子的使用模式。同时,即使这几个同义密码子属于同一种氨基酸,他们的使用频率也是不相同的,也从一方面说明了,基因组中存在着“优势密码子”和“稀有密码子”的现象。FMDV各血清型中的稀有密码子倾向出现于编码起始区,而终止区附近稀有密码子出现的倾向较弱。 关于进化学方面的研究,本实验也采用了生物信息学软

2、件SPSS,将FMDV基因组密码子参考序列的同源性进行了分析与对比,构建了A血清型的VP1基因的进化树,同时也可以通过对O型、A型绘制的进化谱图得到:目前已知的A型口蹄疫毒株与其它毒株序列差异较大。口蹄疫病毒的每种血清型都集中在一个家族中。通过本次研究对FMDV基因组密码子的分析,可以更加清晰的认识到FMDV的遗传多样性,在基因序列上相差也是比较大的。同时也从一方面证实了加强口蹄疫病理学的分析与调查,对FMDV的变异与进化进行实时的监测对于防控FMD起着非常重要的作用。 关键词:口蹄疫病毒(FMDV);密码子偏好性;密码子相对使用概率;方差分析;进化FOOT-AND-MOUTH DISEASE

3、 VIRUS GENOME CODON USAGE PREFERENCE AND ITS EVOLUTION Abstract: The codon usage preference of the FMDV gene coding initiation region and termination region was analyzed. The experiment mainly selected the most representative of the FMDV and the highest infection rate of O-type and A-type for codon

4、preference analysis and the discussion of evolutionary direction. The use of all synonymous codons in the gene pools of these two serotypes was found to vary randomly. Moreover, the frequency of use of several different synonymous codes belonging to the same amino acid is different, among which ther

5、e are dominant codons (RSCU1) and rare codons (RSCU1的时候,这就意味着密码子为偏好性强的密码子,与之相反也是成立的。第一个氨基酸的第j个密码子,计算他的同义密码子使用度的计算公式为公式2-1:RSCUij=Xij1nj=1niij(2-1)在公式2-1中, X ij为编码第一个氨基酸的密码子 X ij出现的次数, n i为编码第二个氨基酸的同义密码子的数目(16)。 对于高表达基因的RSCU值,通常可以用于建立参考表格。(2) 密码子适应指数(Codon Adaptation Index, CAI) 基于已知的高表达基因的序列对未知的基因的密

6、码子采用的偏好进行估测。CAI的值范围在0到1之间,如果CAI的值越高,那么其基因的密码子采用的偏好就会越强。CAI值通常用于预测物种中基因表达的水准,也可用于外来物种基因表达水准的估测。 W ij 代表密码子相对适应度(The relative adaptiveness of a codon)。Wij=RSCUijRSCUimax=XijXimax(2-2)公式2-2中 RSCU imax、X imax这两个分别代表了编码第i个氨基酸的使用频率最高密码子的RSCU值和X值。CAI=(K=1LWk)1L(2-3)L代表的是基因中所采用的密码子数量。(3) 有效密码子数(Effective Nu

7、mber of Codon, ENC) ENC描述了密码子采用偏离随机选取的程度,并且密码子家族当中同义密码子的非平衡运用的偏好程度也可以由ENC充分反映出。如果ENC值在20到61的范围之间,ENC值越近,偏差越强。高表达基因密码子的偏好较大,因此ENC值相对较小;低表达的基因中含有更多种类、更稀有的密码子,所以ENC的值更大。通常比较ENC的值来确定内源基因表达的相对水准。一般情况下,如果ENC值越小,那就说明与其相对应的内源基因的表达性也就越高。 n 代表了基因组中使用的密码子的总数,K代表同义密码子的数量,P i是使用第一密码子的使用频率( n i / n )。 ENC值同时也是会受到

8、氨基酸的构成与基因长度的影响。ENC=2+9F2+1F3+5F4+3F6(2-4)F=ni=1kPi2n-1 n1,Pi=nin(2-5)(4) 密码子偏好参数(Codon Preference Parameter, CPP)CPP的数值在0至18之间, 越接近最大值18,就表示密码子被非随机采用的概率越高。但是它相对于基因编码整体性区域的碱基构成的敏感度并不精确, 适合比较基因之间或者物种间密码子采用偏性的大小。CPP=i=118|xij-j=1nixijni|j=1nixijni(2ni-2)(2-6)Xij代表了编码第i个氨基酸密码子(j)出现的次数,ni代表编码第ni个(当值为2-6且

9、 ni= 1的时候应被排除)氨基酸同义密码子的数目。2.2 研究过程 2.2.1 选取的基因样本在本实验中的FMDV O型和A型的完整编码基因的相关信息来自于Gen- Bank(列举如下)。其中,FMDV O型、A型均为27条,同时都含有完整的多聚蛋白质编码序列。O型EF552697,EF552696,EF552694, EF552693,EF552692,EU400597,EUl40964, AF026168,NC004004,AJ539139,AY593819, AY593835,AFl89157,AFl89157,AY593836, AF511039, EFl75732,DQ248888

10、, AJ320488, AJ633821,AY312588S2,AB079061,AFl89157, AF511039,AY317098,AY312586S2。A型NC011450,EF494488,EF494487, EF494486,AY593751,AY593789,AY593767, AY593770,AY593782,AY593783,AY593784, AY593785,AY593790,AY593801,AY593802, AY593787,AY593788,AY593803,AY593753, AY593756,AY593757,AY593768,AY593794, AY593

11、771,AY593758,AY593775,AY593751。 2.2.2 在给定的区域分析密码子偏好性由于目标区域的每个位点产生的突变现象,可以通过定义密码子使用趋势(TCU Tendency of Codon Usage)的变体进而分析编码序列中给定区域的密码子使用趋势,计算TCU值:TCU是特定区域(即起始位点)每个位置的值的累积值。TCU=RUCU=RSCUij-RSCU0(2-7)表示一个密码子使用偏好性的值,对应于a中的特定氨基酸。n表示此研究中的所有样本。当所有RSCU值根据区域中的特定位置为时,TCB为零。这意味着在该位置存在很少的显性密码子或次要密码子,相反地,当TCB的绝对

12、值远大于时,意味着优化密码子或次要密码子用于特定位置。翻译的初始区域起始位点到第30个下游密码子和从翻译终止的终端区域点到第30个上游密码子。TTC值计算相应的基因组和计算相应基因组的值与TCU值进行比较以解决问题特定区域某些密码子之间的关系和一个相应的基因组。2.3 研究结果 2.3.1 翻译起始区附近密码子的使用偏好性图2-2表现了每个从第三十个密码子起始的特定位点之间的关系,以及FMDV七种亚型的TCU值。每个条形代表特定位点中密码子的使用趋势。TCU值如果越高就说明其对应s位点对在翻译起始区域中出现具有强倾向的密码子。在所有感兴趣的区域中存在几个具有负密码子使用倾向的位点。这表明了,即

13、使他们对整个基因组的血清型的优先使用性更强,一些次要密码子更加容易在在翻译起始区域出现。AA*CodonRSCUAaaCodonRSCUAla+GCA1.02Leu*CUA0.17GCC1.45CUC1.95GCG0.59CUG1.65GCU0.94CUU1.1Arg*AGA1.46UUA0.05AGG0.8UUG1.05Asn*Asp*CysGlnGlu+GlyHis*Ile*CGACGCCGGCGUAACAAUGACGAUUGCUGUCAACAGGAAGAGGGAGGCGGGGGUCACCAUAUAAUCAUU0.331.770.660.971.720.281.50.51.170.830.

14、891.150.711.291.041.20.820.941.750.250.171.81.1LysPheProSer+Thr+Tyr*Val*AAAAAGUUCUUUCCACCCCCGCCUAGCAGUUCAUCCUCGUCUACAACCACGACUUACUAUGUAGUCGUTGUU0.861.141.230.770.821.290.781.11.230.651.021.560.890.760.91.560.60.941.710.290.271.131.620.98表2-1 FMDV中同义密码子使用偏性和密码子偏性Table 2-1 Synonymous codon usage bias

15、and codon bias in FMDV*:aAA是氨基酸的缩写; bRSCU值是平均值; 每个氨基酸的优先使用的密码子以粗体描述;氨基酸包括同义密码子使用之间的差异; 氨基酸包括同义密码子使用中的相对差异。七种血清型中具有负TCU值如图4-1所示。这种现象特别是在下列血清型的不同位点可以体现。血清型A血清型O亚洲型I血清型C血清型SAT-I血清型SAT-II 血清型SAT-III 第2 第3 第3 第2 第3 第2 第3第3 第4 第6 第3 第4 第3 第4第4 第6 第7 第4 第6 第4 第6第5 第9 第9 第6 第14 第6 第7第6 第13 第21 第7 第16 第7 第9第

16、9 第18 第2 第9 第20 第9 第14第18 第19 第24 第11 第23 第20 第16第19 第23 第25 第17 第28 第22 第20第22 第26 第26 第18 第23 第23第23 第28 第22 第26 第28第24 第30 第23 第29 第30第26 第26 第30第30 第28 从某种程度上来说,这些密码子偏好性弱的位点常集中在末端,以及阅读框中部,许多位点存在着较高的偏好性。图4-1 翻译区域中每个位点密码子使用的趋势Fig.1 The tendency of codon usage at each site in the initial translatio

17、n region2.3.2 翻译终止区附近的密码子的偏好性位点图4-2描述了密码子末端翻译区位点的TCU值。将图4-2和图4-1进行比较可以发现,与起始翻译区附近密码子使用的位点一样,这些翻译终止位点没有被优先使用。通过图表发现,只有少数几个具有负偏好性的位点,其他很大一部分位点都更加倾向于使用具有高RSCU值的密码子。图4-2 末端翻译区每个位点密码子使用的趋势Fig.2 The tendency of codon usage at each site in the terminal translation region 2.3.3 方差分析对2.2.1 里由Gen-bank提供的FMDV2

18、7条O型基因与27条A型基因,利用SPSS9.0系统多变量解析软件实现密码子使用偏差与氨基酸采用偏差的方差解析。根据方差分析的数据,将每个基因的59个密码子的相对采用概率当成其属性。进行方差分析时,首先得到2个总体,FMDV的O型毒株的基因序列X1和FMDV A型毒株的基因序列X2 。分别用u1,u2来表示O型、A型单个密码子的RSCU平均值,同时总体性的将每个密码子的RSCU值的平方和,分解成组间平方和SSA与组内平方和SSE,将总自由度分解为,组间自由度(dfA)和组内自由度(dfE)。假设从而建立Ho:u1=u2 :假设密码子的属性没有影响到蛋白质的分类以及蛋白质的计算统计量,最终从F可

19、以得到明显的说明。当显著性水平1)和稀有密码子RSCU1。如果不将二者进行相似性比较的话,单独从图4-1还是4-2中,很难发现各自在密码子使用上的规律。图4-1 FMDV A基因密码子使用模式Fig.1 The pattern of codon usage of FMDV serotype A图4-2 FMDV O基因密码子使用模式Fig.2 The pattern of codon usage of FMDV serotype O通过图4-1与4-2,将这两种血清型的密码子的使用相对概率进行比较,可以明显得观察到:从整体上来讲氨基酸所拥有的相同密码子的使用模式,也通过上述的现象得出这样的结论

20、:口蹄疫病毒(FMDV) O型和A型在基因中密码子的选择机制可能与易感动物细胞内的tRNA丰度是相关的。 2.3.2 FMDV A型和O型基因群落中密码子使用方面的差异对表4-2列出的54条基因序列的密码子,进行使用相对概率的单因素方差分析,密码子使用相对概率有显著差异的F值和显著性水平的关系的数据在表2-1中。从表2-1中能够看出,这些密码子在两种血清型基因群落中的使用偏好性是不同的。很多研究也指出,蛋白质的二级结构与同义密码子的使用这二者之间的关系是非常密切的。利用密码子使用偏性对FMDV O、A两个血清型进行分析,基因群落在分子水平上的变异将获得只通过氨基酸结构类型特征分析或同义密码子使

21、用的宏观分析(见图4-1,4-2)。Amino acidcodonF valueSig.Amino acidcodonF valueSig.AlaGCA2.5750.103LeuCUA3.6980.06AlaGCC14.1390CUC1.1850.281AlaGCG15.5440CUG15.960AlaGCU0.0520.821CUU0.380.54ArgAGA4.720.034UUA0.9060.346ArgAGG2.8330.098UUG0.6670.481ArgArgArgAsnAspCysCysGlnGlnGluGluGlyGlyGlyGlyHisHisIleIleIleCGACGCC

22、GGCGUAACAAUGACGAUCAGGAAGAGGGAGGCGGGGGUCACCAUAUAAUCAUU0.3760.6676.3970.0190.0490.0561.2242.1421.023201860.243.1510.4660.4172.49849.5430.3348.2895.0274.9714.5931.246.1670.5420.4180.0150.9820.8270.8140.2740.1490.3170.1450.6260.0820.4980.5110.12T00.5660.0060.0290.030.0370.2710.016ProSerThryrTyrValPheLys

23、CCACCCCCGCCUAGCAGUUCAUCCUCGUCUACAACCACGACUUACUAUGUAGUCGUGGUUUUCUUUAAAAAG0.9834.840.8013.69913.4340.9041.5440.4090.01815.516163.26694.2646.275504160.0370.5040.1751.1590.0010.0581.2591.5251.8240.080.3260.0320.3750.060.0010.3460.220.5250.8950000.0150.0240.8490.4810.6780.2870.9840.810.2670.2220.1830.778

24、表2-1 密码子使用的F值和显著性水平值Table 4-1. The value of F and significance of the codon usage 2.3.3 密码子使用偏好性在口蹄疫病毒(FMDV)中RSCU的 RSCU总值为59个密码子,分别显示在表2-2中。具有强烈偏好性的密码子和相对偏好行的相对偏好性的密码子分别被星号*标记。对于他们来说有具强偏好性的密码子以及弱偏好性的密码子存在于相同的氨基酸中。表2-2代表了每个特定位点之间存在的关系(从起始密码子到第30个密码子和FMDV0中TCU的七种血清型。每个条形代表在特定地点使用密码子的倾向。TCU如果较高就说明在起0始区

25、域相应位点倾斜,在翻译中出现具有强烈偏好性。这个现象说明了有一些负偏好性的位点也会出现在偏好性区域。这意味着一些次要密码子趋向于出现在翻译起始区域,而它们是低优0.015先用于这些的全基因组血清型。大部分参考毒株L氨基酸片段的插入或缺失相对来说都是比较少的。起始密码子是高度保守的,同时发现了2个密码子之间只有1个氨基酸残基,C6 没有发生变化;L 氨基酸的替换主要集中在i末端,其余的71维持原样不变;凸显位点像L52,149,165,77,110与139都是非常保守的。2A氨基酸的同源性大概为75; 2B片段当中的131个残基始终保持不变,尤其是在跨膜区;2C更加保守,84氨基酸保持不变,保守

26、基序分别是GKSGQGK,DDLG和NKLD; 3A插入或者缺失时常产生于3A的80-110和130-153中,这充分证实了3A为FMDV的可变蛋白。 51的残留物保持不变;3B片段相对保守,突变重点发生在C末端; 3D突变率是14,重点集中于序列GVFNPEFGPAALSNKD,跨膜CRCAADYASRLHSVLGT和HGVFNPEFG-PAALSNKDP; 其他的主要的保守位点为245D,295G,307N,337G,338D,339D,和保守的基序KDEIR,YGDD,PSG,FLKR还有抗原表位。 GLIVDTRDVEER,EDKALLFRR。第3章 口蹄疫病毒的进化3.1 口蹄疫病毒

27、基因组的进化关系分析对20个口蹄疫病毒O 型 和5个亚洲1型多聚蛋白的氨基酸序列进行比较,构建口蹄疫病毒(FMD)菌株的分子系统发育树。 进化方法(图3-1)。 结果表明,口蹄疫病毒的每种血清型都集中在一个家族中,系统发育树分为两个支链,一个是O 型口蹄疫病毒,另一个是足趾病毒。亚洲1型口disease病病毒,口蹄疫O / CHA / 99株与O NY00株最密切相关。图3-1 O型口蹄疫病毒基因组进化树Figure 3-1 O type foot-and-mouth disease virus genome evolution tree3.2 构建A型FMDV VP1的系统树从NCBI下载了

28、A型口蹄疫病毒的VP1 基因,构建了A型I=1蹄疫VP1的系统树(图3-2)。建立的进化树中,1079条VP1序列被分为3个大群 (Cluster),24个亚群。图3-2 A型口蹄疫病毒VP1 基因的系统进化树Fig.3-2 The phylogenetic tree of A type FMDV constructed on VP1 gene使用Mega 6.0对HY-VPI与1077个参考毒株和疫苗株 AF/72进行了系统进化分析,发现中国报道的毒株均处于 Cluster 3.6和3.8分支中可以通过FMDV A血清型VP1基因的进化树以及O血清型基因的进化树得出这样的结论:口蹄疫病毒的特点是:亚群数量众多、具有较高的复制突变率、同时繁殖率较高耗时短等生物学特征,可以作为非常好的材料与模型用以物种进化的研究。利用FMDV基因组密码子的多种机制以及环境压力的作用, FMDV始终保持着适应性的进化过程,从而也展现出丰富的遗传多样性。第4章 FMDV基因组密码子偏好性与进化的讨论4.1 FMDV基因组密码子偏好性的讨论tRNA丰度也是影响密码子偏好性的一个重要因素。对密码子的选择会随着tRNA丰度的变化而选择相应的同义密码子,高表达基因偏好使用tRNA丰富的密码子或者能够与tRNA更好结合的密码子,这些现象可能与密码子的使用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论