生物信息学课程论文 番茄WRKY26基因的生物信息学分析.doc_第1页
生物信息学课程论文 番茄WRKY26基因的生物信息学分析.doc_第2页
生物信息学课程论文 番茄WRKY26基因的生物信息学分析.doc_第3页
生物信息学课程论文 番茄WRKY26基因的生物信息学分析.doc_第4页
生物信息学课程论文 番茄WRKY26基因的生物信息学分析.doc_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

键入文字生物信息学结课论文键入文字番茄WRKY26基因的生物信息学分析摘要:番茄(Lyeopersicon escaleutum.Mil1)是世界上重要的蔬菜作物之一,已经成为蔬菜基因工程研究的模式植物之一。由于环境污染,气候条件不断恶化,使地球上的生物生存环境遭受到越来越严重的危害,因此番茄非生物抗逆性改良的研究工作就更显得迫切和重要。已有研究证明WRKY转录因子可参与多种植物抗性反应, WRKY26基因存在于番茄中,其编码的WRKY26转录因子对番茄抗旱性有重要调控作用,研究其生物学功能显得尤为重要。本文采用生物信息学的方法对已在 GenBank 上登录的番茄WRKY26基因的核酸及氨基酸序列、组成成分、同源性比对、编码蛋白质的理化性质、信号肽、跨膜结构域、亲、疏水性、蛋白质结构及功能域等进行预测和推断。结果表明:该基因的ORF长度为1608bp且与马铃薯STWRKY8同源性很高,该基因编码的蛋白质分子量为分子量为59624.9, 等电点为6.87,为酸性疏水性蛋白质,且不稳定。该蛋白质无信号肽和跨膜结构域,属于非分泌蛋白质。蛋白质结构表明该蛋白主要为转角和无规则卷曲,没有螺旋。通过此次研究,希望为今后深入研究该类基因的功能和结构特征提供依据。关键词:番茄;WRKY26基因;蛋白质功能;同源性前言番茄基因组中,数目众多的转录因子参与植物的生长发育、物质代谢、响应生物和非生物胁迫等多种生物进程。WRKY基因家族是植物重要的转录因子家族,在抗病信号转导途径中起重要调控作用,因而成为分子植物病理研究领域中的热点。WRKY转录因子是一类植物所特有的抗逆相关转录因子超家族,在植物生物、非生物胁迫1以及植物的生长发育和多种代谢途2的调控中起重要作用。近年来的研究发现,转录因子和抗逆基因会对环境胁迫作出响应。一个抗逆基因的超表达只能提高植物单一抗性,而一个转录因子基因的超表达能够激活多个下游抗逆基因的表达,从而提高植物综合抗逆能力。所以与单抗基因相比,转录因子已成为作物改良的研究热点。尤其是WRKY转录因子,因其可显著地调控植物生物和非生物胁迫,更是备受关注3。WRKY家族中的大部分成员受到水杨酸(SA)、NaCl、低温等刺激后会诱导表达4-6。Qiu等7发现OsWRKY45可在病原菌的诱导下表达,并提高转基因拟南芥的抗病性,说明WRKY基因还具有潜在的抗病能力。现已证明WRKY可参与多种植物抗病反应8。番茄作为重要的模式植物周年生产中常受到高盐、低温、病原菌的影响,其遗传改良越来越受到重视9。所以研究WRKY26基因的生物信息学功能显得尤为重要,可以为转基因番茄等其他遗传操作提供技术储备。 一.基因的查找,在NCBI中查找基因序列mRNA sequencegi|723709376|ref|XM_004241707.2| PREDICTED: Solanum lycopersicum probable WRKY transcription factor 26 (LOC101255501), mRNAGTATCTTCTTTCTTTTAATGGCTGCTTCAAGTTTCTCTTTTCCCACTTCATCTTCTTCATTCATGACGACTTCTTTCACCGACCTTCTTGCTTCTGATGATTATCCAACCAAAGGACTTGCTGATAGAATTGCAGAGAGGACTGGTTCTGGAGTTCCTAAATTCAAATCTCTTCCACCTCCTTCACTTCCATTATCGCCTCCTCCTTTTTCGCCTTCCTCTTACTTTGCTATTCCTCCTGGTTTAAGTCCAACTGAACTTTTAGACTCCCCTGTTCTTTTGTCTTCTTCAAACCTTCTTCCATCTCCGACGACTGGGAGTTTTCCATCTCGTGCTTTTAATTGGAAGAGCAGTAGTCATCAGGATGTGAAACAGGAAGACAAAAACTACTCAGATTTTTCTTTCCAGCCTCAAGTAGGGACAGCTGCATCATCAATCTCTCAATCTCAAACTAACCATGTCCCTCTGGGGCAGCAAGCATGGAATTGTCAAGAGCCCACAAAACAGAATGATCAAAATGCTAATGGAAGATCCGAATTCAACACTGTACAGAATTTTATGCAGAATAATAATGATCAGAACAATAGTGGAAACCAATACAATCAGAGTATAAGGGAGCAGAAAAGGTCAGATGACGGATACAATTGGAGGAAATACGGGCAGAAACAAGTAAAAGGTAGTGAAAATCCGAGAAGCTACTACAAGTGTACATACCCAAATTGTCCCACCAAGAAGAAGGTTGAGAGATCTTTAGATGGTCAAATTACTGAAATTGTGTACAAGGGTAATCACAACCATCCAAAGCCTCAGTCTACCAGAAGATCGTCATCATCCACAGCTTCATCTGCATTCCAATCTTACAATACACAAACTAATGAAATTCCAGATCATCAATCCTATGGTTCAAATGGACAAATGGATTCCGTTGCAACACCTGAGAATTCTTCGATTTCATTTGGGGATGATGATCATGAACACACTTCTCAAAAGAGTAGTAGGTCAAGAGGAGATGATCTTGATGAAGAGGAACCAGACTCAAAAAGATGGAAAAGAGAAAACGAAAGTGAAGGTGTATCTGCACTAGGAGGGAGTAGGACAGTTAGAGAACCTAGAGTTGTAGTTCAAACTACGAGTGACATCGATATCCTAGATGATGGTTATAGATGGAGGAAGTATGGTCAAAAAGTAGTGAAAGGAAATCCTAATCCCAGGAGCTACTACAAATGCACAAGTACGGGATGTCCAGTAAGAAAACATGTGGAAAGGGCATCACAAGACATAAGGTCAGTGATAACAACCTATGAAGGGAAGCACAACCATGATGTTCCAGCAGCAAGGGGCAGTGGCAACCACTCAATTAACCGACCTATGGCACCGACCATAAGGCCTACTGTGACATCTCATCAATCCAACTATCAAGTTCCATTACAAAGTATAAGGCCACAACAGTCTGAAATGGGAGCACCCTTTACACTAGAGATGTTGCAGAAGCCTAATAATTATGGTTTCTCAGGATATGCAAATTCAGGGGATTCATATGAAAACCAAGTTCAGGACAATAATGTGTTTTCGAGAACTAAGGACGAGCCTCGAGATGACTTGTTTATGGAGTCATTGCTTTGCTGAAACTGGAATCCTAGAAAGGAGCACGAATTGAAGTTTATGAAACGAAAAACTGAACCTTTTATTTATTTATTTTTGCATAAAGAATATGATAGGAAGCATTTTGATTTCATTTGTTAATAGATCATATACTGTTTTTTTTTTTGGTGTGTGTACATTTTGTACTAGGAAATTTGTTTGTTGTAAATTCAATCAAATGCGGTGTAGATGTTCATGCAGTTACCACTGTTATGGGGGTTATATAATTTAGGATAGGAATGTAAATCCCCAACTCATGACTATATGACACTGATTCTTTATTTCTATCACATTTTCAAGTTTTATATATTAAAGAAGATTGCAGTTTTTCAAProtein sequencegi|460392301|ref|XP_004241755.1| PREDICTED: probable WRKY transcription factor 26 Solanum lycopersicumMAASSFSFPTSSSSFMTTSFTDLLASDDYPTKGLADRIAERTGSGVPKFKSLPPPSLPLSPPPFSPSSYFAIPPGLSPTELLDSPVLLSSSNLLPSPTTGSFPSRAFNWKSSSHQDVKQEDKNYSDFSFQPQVGTAASSISQSQTNHVPLGQQAWNCQEPTKQNDQNANGRSEFNTVQNFMQNNNDQNNSGNQYNQSIREQKRSDDGYNWRKYGQKQVKGSENPRSYYKCTYPNCPTKKKVERSLDGQITEIVYKGNHNHPKPQSTRRSSSSTASSAFQSYNTQTNEIPDHQSYGSNGQMDSVATPENSSISFGDDDHEHTSQKSSRSRGDDLDEEEPDSKRWKRENESEGVSALGGSRTVREPRVVVQTTSDIDILDDGYRWRKYGQKVVKGNPNPRSYYKCTSTGCPVRKHVERASQDIRSVITTYEGKHNHDVPAARGSGNHSINRPMAPTIRPTVTSHQSNYQVPLQSIRPQQSEMGAPFTLEMLQKPNNYGFSGYANSGDSYENQVQDNNVFSRTKDEPRDDLFMESLLC二开放阅读框(ORF)的查找开放阅读框(Open Reading Frame, ORF)是基因序列中的一段无终止序列打断的碱基序列,可编码相应的蛋白。在没有其它信息的前提下,DNA序列可能按六种框架阅读和翻译(每条链三种,对应三种不同的起始位点)。ORF识别包括检测这六个阅读框架并决定哪一个包含以启动子和终止子为界限的DNA序列而其内部不包含启动子或终止子,符合这些条件的序列有可能对应一个真正的单一的基因产物。ORF的识别是证明一个新的DNA序列为特定的蛋白质编码基因的部分或全部的先决条件。使用ORFfinder查找番茄WRKY26基因开放阅读框,这里使用默认参数,结果如图2.1所示。图2.1WRKY26的ORF预测结果结果表明:如图2.1显示了ORFFinder预测结果,给出了6个阅读框中可能的ORF图示、编码相位、位置及长度,这是根据六种不同的编码方式得到的(包括正反链)。从预测结果可以看出,一个DNA序列可能有多个ORF。相对而言,一段连续较长的ORF比较短的ORF更可能是编码序列。图中第三条(紫色标注)为该基因的开放阅读框,其从18号碱基到1625号碱基,长度为1608bp。在上述mRNA序列中使用灰色底纹标注出开放阅读框序列。三引物的设计 用Primer 5.0设计引物,根据实验需要(巢氏PCR),设计内侧引物和外侧引物。并且在内侧引物两端加入酶切位点,分别为XbaI ,SacI酶切位点。 表3.1引物序列名称引物序列SlWRKY31-F1CCCATTGCACTCTTGTATCTTSlWRKY31-R1TCAATTCGTGCTCCTTTCTAGSlWRKY31-F2TCTAGAATGGCTGCTTCAAGTTTCTC (XbaI)SlWRKY31-R2 GAGCTCTCAGCAAAGCAATGACTCC (SacI)图3.1外侧引物设计图3.2 内侧引物设计四同源性比对 使用Blastn进行序列对比,选用RNA数据库,限定物种为番茄,其他参数默认,只有一条序列。图4.1限定物种 Blast结果条件改为不限定物种,其他参数默认图4.2不限定物种Blast结果图4.3不限定物种Blast结果五同源性分析下载不同物种与番茄WRKY26的同源蛋白质序列,共计7条,使用MEGA5.1制作进化树。使用Pairwise blastp、emboss_needle、emboss_water程序比对上述氨基酸序列中的两条,其中均使用EBLOSUM62矩阵。表5.1 蛋白质序列 名称登录号番茄(Solanum lycopersicum)XP_004241755.1 马铃薯(Solanum tuberosum)NP_001274836.1烟草(Nicotiana sylvestris)XP_009790461.1白梨(Pyrus x bretschneideri)XP_009372253.1苹果(Malus domestica)XP_008350560.1芝麻(Sesamum indicum)XP_011095229.1甜菜(Beta vulgaris)XP_010685944.1 表5.2氨基酸序列比对程序 得分值一致性 相似性 空位 Pairwise blastp 1074522/537(97.0%) 528/537(98.0%) 3/537(0%) emboss_needle 2771.5522/537(97.2%)528/537(98.3%)3/537(0.6%)emboss_water 2771.5522/537(97.2%)528/537(98.3%3/537(0.6%) 图5.1进化树如图5.1所示:1) 同属于茄科的马铃薯、番茄和烟草聚成一个亚类,这说明它们的亲缘关系很近,其中番茄和马铃薯的同源性极高。2) 甜菜和番茄尽管在一个类群,但是甜菜在外侧,说明它们亲缘关系较远。3) 从表5.2也可以看出番茄WRKY26基因编码的蛋白质和马铃薯STWRKY8基因编码的蛋白质的相似度非常高,说明两个基因的同源性很高,与进化树分析结果相同六.蛋白质理化性质分析使用ExPASy - ProtParam tool分析氨基酸序列。表6.1氨基酸组成氨基酸 数量 比例 氨基酸 数量 比例Ala (A) 21 3.9% Arg (R) 30 5.6%Asn (N) 39 7.3% Asp (D) 33 6.2%Cys (C) 6 1.1% Gln (Q) 37 6.9%Glu (E) 26 4.9% Gly (G) 32 6.0%His (H) 12 2.2% Ile (I) 15 2.8%Leu (L) 24 4.5% Lys (K) 28 5.2%Met (M) 8 1.5% Phe (F) 19 3.6%Pro (P) 42 7.9% Ser (S) 78 14.6% Thr (T) 34 6.4% Trp (W) 5 0.9% Tyr (Y) 21 3.9% Val (V) 25 4.7%Pyl (O) 0 0.0% Sec (U) 0 0.0%名称理论等电点带正电氨基酸带负电氨基酸不稳定系数脂肪系数总平均疏水性化学式分子量数值6.875859 60.1545.91-1.062C2562H3948N758O863S14 59624.9表6.1氨基酸序列ExPASy分析结果结果分析:1) 总的亲水性平均系数(GRAVY)为-1.062,由于总的亲水性平均系数可以体现蛋白质的亲疏水性质,数值越大代表亲水性越强,越低代表越弱。由于-1.062 0.800 2 : 0.800 diff 0.600 3 : 0.600 diff 0.400 4 : 0.400 diff 0.200 5 : 0.200 diff3)综合上述分析,P07597和P35334蛋白具有信号肽,P13086位于线粒体内。十一.蛋白质三级结构分析 蛋白质的生物学功能是由高级结构决定的。对蛋白质高级结构的预测和分析,有助于理解蛋白质结构与功能之间的相关性。使用SWISS PDB Viewer分析该蛋白质序列的三级结构。图11.1 蛋白质三维结构图结果表明:该蛋白质有5个转角区域以及一些无规则卷曲,没有螺旋区域。参考文献1Pozueta-romero J,HOULNEG,CANAS L,et al.Enhanced regener-ation of tomato and pepper seedling explants for Agrobacterium-mediated transformationJ.Plant Cell Tissue and Organ Culture,2001,67:173-180.2Van Roekel J S C,Damm B,Melchers L S,et al.Factors influencing transformation frequency of tomatoJ.Plant Cell Rep,1993,12:644-647.3Qiu Y P,Jing S J,Fu J,et al.Cloning and analysis of expression profile of 13SIWRKYgenes in riceJ.Chinese Science Bulletin,2004,49 (20):1860-1869.4孙晓春,高永峰. 番茄SIWRKY23基因的克隆及其抗病性和耐盐性分析J.中国农业学报,2014,16(5):39-465McCormick S, Niedermeyer J. Leaf disctransformation of cultivated tomato usingAgrobacterium tumefaciensJ.PlantCellRep. 1986, (5): 81-846Sanford J C,Reisch B I,Reisch B I.Attempted pollen-mediated plant transformation employing genomic donor DNAJ.Theoretical and Applied Genetics,1985,69:571-574.7Qiu Y P,Yu D Q.Over-expression of the stress-induced OsSIWRKY45 ArabidopsisJ.Environmentaland Experimen-tal Botany,2009,1(65):35-478赵红英,祝建波,王爱英,等

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论