毛竹硝酸还原酶基因的结构预测及分析.docx_第1页
毛竹硝酸还原酶基因的结构预测及分析.docx_第2页
毛竹硝酸还原酶基因的结构预测及分析.docx_第3页
毛竹硝酸还原酶基因的结构预测及分析.docx_第4页
毛竹硝酸还原酶基因的结构预测及分析.docx_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

毛竹硝酸还原酶基因的结构预测及分析齐兵 生科111 201101220238摘要:应用电子克隆技术,以麻竹其中一条EST序列为种子序列,获得了麻竹纤维合成酶基因的一条CDNA序列。采用生物信息学方法,对该基因的核苷酸序列分析,包括核酸序列组分分析,限制性核酸内切酶分析,ORF阅读框识别并进行可靠性验证;并且对该基因编码蛋白从氨基酸组成、理化性质、跨膜区、疏水性、信号肽、Coil区、空间结构及结构域等方面进行预测和分析;同时,利用siDESIGN设计了siRNA,并利用ClustalX与其他物种同源序列比对,利用MEGA5软件通过NJ法构建系统发育进化树,并对该CDNA进行了引物设计,以便于为今后麻竹纤维素合成酶基因的实验克隆和功能验证奠定基础。结果表明:麻竹纤维合成酶基因的CDNA序列全长为822bp,氨基酸数为290个,分子量约为33320.0,等电点为8.01,分子式为C1480H2273N407O425S21Se1,在组成20种氨基酸中,ILe 和Gly所占比例最高,均为7.9%,而Trp所占的比例最低,为1.7%.纤维素合成酶的不稳定系数为47.53,脂肪指数75.69,根据Guruprasad方法表明麻竹纤维素合成酶不稳定。麻竹纤维素合成酶蛋白大约在250-280位氨基酸之间含有一个典型的疏水性区域,没有预测出明显的信号肽,利用Coils Server在线分析麻竹纤维素酶蛋白Coils区,均检测到麻竹纤维酶蛋白含有两个典型的卷曲螺旋结构,其中在140-190为氨基酸的置信值非常高,并且利用SMART服务器搜索麻竹蛋白结构功能域,发现该蛋白在第128-271位之间有个保守的结构功能域-Cellulose-synt,该Cellulose-synt家族成员共有的典型的结构域,该结构功能域由植物纤维素合酶的CesA蛋白,有高度的保守性残基,具有结构分子活性。同时也对麻竹纤维素酶基因RNA的二级结构进行预测,其结构在最小自由能为-226.68千卡/摩时能量最低最稳定图。并利用DNAMAN软件对该麻竹纤维素酶基因进行siRNA预测,并且在对该蛋白进行相关数据分析的基础上,又利用siDESIGN设计了siRNA,在50条结果中选出7条打分值在85以上的。通过NJ法构建系统发育进化树中,葡萄科属植物与麦类植物亲缘关系较近,麻竹与这两种物种趋于同一等级,且与豆科类植物亲缘关系较远。关键词:麻竹 纤维素合成酶 电子克隆 生物信息学 进入21世纪以来,人类在能源、资源、环境等方面面临着越来越严峻的挑战。中国的问题特别突出:一方面,中国的石油对外依存度已经过半,大部分石油消费要靠进口,国家的能源安全和经济安全无法得到保证;同时,大量使用矿石燃料又严重污染环境,中国已经成为最大的温室气体排放国之一,面临国际上巨大的减排压力。寻找替代石油的可再生资源已成为紧迫任务。生物质资源是可以大量再生的,其利用过程中产生的CO2又会被植物吸收,形成碳封闭循环,不会影响环境。随着石油资源的日益短缺,利用工业生物技术将生物质快速转化为液体燃料和化工产品,经过充分利用后再排放,将形成新的封闭循环,实现人类社会的持续发展。因而,化学工业已经开始逐步形成由石油资源向生物质资源的历史性、革命性转变。木质纤维素是地球上来源最丰富的生物质资源13,若能将其有效降解成葡萄糖并用于燃料乙醇生产, 对于改善目前资源紧张的状况将具有重要意义。 竹子是世界重要的森林资源之一,随着全球环境的变化和森林资源的锐减,竹子作为一种生长迅速、再生性强的非木质植物资源,在缓解木材供需矛盾方面发挥着重要作用,其开发利用受到了国际社会的高度关注。竹子纤维素含量直接影响到其应用价值,而纤维素合成酶是纤维素生物合成的关键酶和特征酶,纤维素合成酶基因的转录与表达水平直接影响到纤维素的含量和品质,从而影响到竹子的经济价值。 电子克隆法是近年来基于表达序列标签( expressed sequence tag, EST)和基因组数据库发展起来的基因克隆新型技术, 其利用生物信息学知识和计算机技术对EST或基因组数据库中进行同源性比较分析、整理拼接出新基因的编码序列, 并通过生物学实验进行编码序列和功能验证,为人类功能基因组学与蛋白质组学研究提供新的线索和基础。电子克隆技术是加速基因克隆的一条有效途径。 本论文以麻竹(Dendrocalamus latiflorus Munro)的一条EST序列为种子序列,通过BLASTn程序搜索Genbank的麻竹的EST数据库,利用电子延伸的方法,合成一条CDNA,并对该基因及编码的蛋白质进行生物信息学分析。1、材料和方法11 材料 登陆美国国立生物技术信息中心(/),以“D.latiflorus Munro”为关键词搜索麻竹EST数据,共得到9574条EST数据,并选择其中一条感兴趣的EST,本次选取一条AC为JK008516的EST,并对该条EST进行电子延伸,得到一条CDNA,并以该条序列进行分析并预测其ORF。再利用在线资源(/sms/)对所需的ORF进行翻译得到蛋白质一级结构。接着,利用ProtScale对蛋白质序列进行疏水性质进行预测。之后,利用其他在线资源对蛋白质分子量、分子式、等电点(PI)、半衰期、跨膜蛋白、蛋白的结构域与motify搜索、蛋白质二、三级结构以及信号肽和蛋白质功能等相关内容分析。然后,利用siDESIGN设计了siRNA。同时,并利用ClustalX与其他物种同源序列比对,利用MEGA5软件通过NJ法构建系统发育进化树,并对该CDNA进行了引物设计。2、 21 麻竹纤维素合成酶基因的核酸序列分析 把麻竹EST数据库中感兴趣的一条EST(本次选用AC为JG296632)基于GenBank中的非冗余数据库进行Blast分析,大概预测其功能。将这条EST在麻竹的EST数据库中进行搜索, 找到部分重叠的EST进行拼接,经严格聚类分析,尽量避免含有旁系同源基因,拼接后产生的按位点顺序列出2 BsiI 223 Mph1103I 337 GoxI 337 SurI2 Bst2BI 223 NsiI 337 Bce751I 337 Bsp46I2 BssSI 223 EcoT22I 337 GinI 337 Uba1098I134 Sru4DI 223 SepI 337 GdoI 337 Ali12258I134 AsnI 225 VchO68I 337 GseIII 337 Bsp4009I134 PshBI 225 BbuI 337 NasBI 337 Uba1163I134 AseI 225 CglAI 337 Bca1259I 337 Uba1167I134 BpoAI 225 BtgAII 337 Mlu23I 337 Uba1172I134 VspI 225 Uba1226I 337 DdsI 337 Uba1173I147 Bsp28I 225 Uba1162I 337 Nsp29132II 337 Uba1205I147 BspJ74I 225 PaeCI 337 NspSAIV 337 Uba1224I147 Bsp22I 225 PaeI 337 CelI 337 Ali12257I147 Uba1437I 225 Bsp121I 337 OkrAI 337 Bsp30I147 Uba1444I 225 SpaHI 337 Pac1110I 337 Uba1242I147 Bco35I 225 SphI 337 Pae177I 337 Uba1250I147 BpmI 225 SpaXI 337 Bco10278I 337 Uba1258I147 GsuI 225 Asp5HI 337 BnaI 337 Uba1297I150 BseRI 255 Bsp24I 337 Bsu90I 337 Uba1302I193 AlwNI 275 BglI 337 Bsu8646I 337 Uba1324I210 BpoAI 275 VanI 337 Bsu8565I 337 Uba1325I210 PshBI 275 BsoJI 337 BamNI 337 Uba1334I210 Sru4DI 275 Uth506I 337 BstQI 337 Uba1339I210 VspI 275 Tsp8EI 337 BamKI 337 Uba1346I210 AseI 294 KasI 337 BamHI 337 Uba1383I210 AsnI 295 SseAI 337 BamFI 337 Uba1398I219 Ppu10I 295 NunII 337 Psp56I 337 Uba1402I221 VchO68I 295 BinSII 337 RhsI 337 Uba1414I221 Uba1226I 295 PatAI 337 Rlu4I 337 AinII221 Bsp121I 295 PmnI 337 Atu1II 337 AccEBI221 PaeCI 295 NdaI 337 BstI 337 Uba19I221 Uba1162I 295 SfoI 337 SolI 337 Uba31I221 BfrBI 295 NarI 337 AspTII 337 Uba38I221 SphI 295 NamI 337 BsaDI 337 Uba51I221 CglAI 295 MsaI 337 Bst2902I 337 Uba88I221 BtgAII 295 Mly113I 337 Bst2464I 337 Bsp130I221 BbuI 295 MchI 337 AsiI 337 Bsp131I221 Asp5HI 295 McaAI 337 Bst1126I 337 AcaII221 SpaHI 295 BbeAI 337 SpvI 337 Bsp144I221 SpaXI 296 EheI 337 ApaCI 337 AaeI221 PaeI 296 Eco78I 337 AliI 337 MleI223 PinBI 298 BbeI 337 Bsp98I 337 AacI223 Zsp2I 未被下列酶剪切AaaI AagI AaqI AatI AatII AbrIAcaI AcaIII Acc113I Acc16I Acc65I AccB7IAccBSI AccIII AceII AceIII AclI AclNIAcpI AcpII AcrII Acs1371I Acs1372I Acs1373I限制性酶切分析 2-1-2 从限制性酶切分析结果2-1-2,列出能被剪切的内切酶以及酶切位点在序列中的位置,如ScaI 、 EcoICRI、 SacI 等酶切位点,同时还列出未被剪切的内切酶,如BamHI、 PstI、 BclI等酶切位点。Blastn比对结果2-1-5 ORF Finder预测结果2-1-3:给出6个阅读框。相对而言,一段连续较长的ORF更有可能是编码序列。这里选择+3相位的ORF,可得其长度为814bp(9bp-821bp),对应有271个氨基酸。对查找到的ORF所翻译的氨基酸序列(如图2-1-4)到NCBI进行BLASTN,得到如图2-1-5,比对结果搜索到多个显著性极相似的序列,说明预测到的ORF可靠。接着利用DNAMAN可找出该条CDNA进行PCR所需的扩增引物,分别为CGGTGATAAGCAACAGCC(5Primer),AACATCCAGTGCCAAGGT(3Primer)。2 .2 麻竹纤维素合成酶蛋白序列分析2.2.1麻竹纤维素合成酶蛋白理化性质分析蛋白质理化性质2-2-1 利用在线资源对蛋白质分子量、分子式、等电点(PI)、半衰期等相关理化数据进行分析。可以得出以下信息(2-2-1):氨基酸数为290个,分子量约为33320.0,等电点为8.01,分子式为C1480H2273N407O425S21Se1,在组成20种氨基酸中,ILe 和Gly所占比例最高,均为7.9%,而Trp所占的比例最低,为1.7%.纤维素合成酶的不稳定系数为47.53,脂肪指数为75.69,根据Guruprasad方法表明麻竹纤维素合成酶不稳定。2.2.2 麻竹纤维素酶蛋白的疏水性、亲水性分析利用DNAMAN分析麻竹纤维素酶蛋白的亲疏水性分析2-2-22.2.3麻竹纤维素酶蛋白的跨膜片段分析利用DNAMAN分析麻竹纤维素酶蛋白跨膜结构域分析2-2-42.2.4麻竹纤维素酶蛋白蛋白的信号肽预测及结构域分析2.2.5麻竹纤维素酶蛋白蛋白的结构域分析利用SMART对该麻竹蛋白结构功能预测2-2-10通过利用InterProscan在线资源分析蛋白质结构域和功能位点对该蛋白质的结构与

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论