生物信息学在园林中的应用_第1页
生物信息学在园林中的应用_第2页
生物信息学在园林中的应用_第3页
生物信息学在园林中的应用_第4页
生物信息学在园林中的应用_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、生物信息学在园林植物的应用拟南芥MYB基因生物信息学分析MYB类转录因子家族是指含有MYB结构域的一类转录因子。MYB结构域是一段约51-52个氨基酸的肽段,包含一系列高度保守的氨基酸残基和间隔序列。其功能是参与植物苯丙烷类次生代谢途径的调节,苯丙烷类代谢是植物主要的3条次生代谢途径之一,它起始于苯丙氨酸,经过几个共同步骤后,分成两个主要分支途径,其中一条分支称为黄酮类代谢途径 ,主要与植物色素合成相关。R2R3-MYB转录因子作为调节蛋白广泛参与苯丙烷类代谢途径的调控。 从NCBI中调取MYB转录因子的DNA序列:gi|ref|NM_.4| Arabidopsis thaliana myb

2、family transcription factor mRNA, complete cdsTTTCTCTCACTTTCCCGGGAAAATCGGCGACCAAAATTGGAAAATGTACTCAGCGATTCGCTCGCTTCCACTCGATGGTGGACACGTTGGTGGTGACTACCATGGACCTCTTGACGGAACCAATCTTCCCGGTGACGCTTGTTTGGTTTTAACGACTGACCCTAAACCTCGTCTCCGGTGGACAACTGAGCTTCATGAGAGATTCGTTGACGCCGTTACTCAGCTCGGTGGTCCTGACAAAGCGACTCCCAAAA

3、CTATTATGAGAACAATGGGAGTGAAGGGTCTCACTCTCTACCACCTCAAATCACATCTTCAGAAATTCCGCCTAGGGAGGCAAGCTGGCAAAGAATCAACTGAGAACTCTAAAGATGCTTCTTGTGTAGGGGAGAGTCAGGACACAGGTTCATCTTCGACATCATCAATGAGAATGGCGCAGCAGGAGCAGAACGAGGGTTACCAAGTCACCGAAGCTCTACGTGCTCAGATGGAAGTCCAAAGAAGACTACACGATCAATTGGAGGTGCAACGGAGGCTCCAGCTGAGGATAGAGGCAC

4、AAGGAAAATACCTGCAATCGATTCTTGAAAAAGCTTGCAAGGCCTTTGACGAGCAAGCTGCTACTTTTGCTGGACTTGAGGCTGCTAGGGAAGAGCTATCAGAGCTAGCCATCAAAGTCTCCAATAGCTCTCAAGGAACATCAGTCBLAST(/Blast.cgi?PAGE_TYPE=BlastSearch&BLAST_SPEC=OGP_3702) 将MYB基因序列和拟南芥基因组序列进行BLAST分析,发现其与拟南芥3号染色体完全吻合。Graphic SummaryPromote

5、r Scan(/molbio/proscan/) 采用Promoter Scan预测其启动子区域,结果并未发现启动子区域。CpGplot(http:/www.ebi.ac.uk/Tools/seqstats/emboss_cpgplot/)采用CpGplot分析MYB基因,发现CpG岛一处,长度为208bp,位置为50-257。CPGPLOT islands of unusual CG compositionNM_.4 from 1 to 1110 Observed/Expected ratio 0.60 Percent C + Perce

6、nt G 50.00 Length 200 Length 208 (50.257)蛋白质序列分析拟南芥MYB基因编码氨基酸比较多,从NCBI调取其相关序列如下:gi|emb|CAA90748.1| MYB-related protein Arabidopsis thalianaMGRRPCCEKIGLKKGPWSAEEDRILINYISLHGHPNWRALPKLAGLLRCGKSCRLRWINYLRPDIKRGNFTPHEEDTIISLHQLLGNRWSAIAAKLPGRTDNEIKNVWHTHLKKRLHHSQDQNNKEDFVSTTAAEMPTSPQQQSSSSADISAITTLGNNND

7、ISNSNKDSATSSEDVLAIIDESFWSEVVLTDCDISGNEKNEKKIENWEGSLDRNDKGYNHDMEFWFDHLTSSSCIIGEMSDISEFMVQTETDQRMGLNLNLSIYSLPKPLSQFLDEVSRIKDNHSKLSEIDGYVGKLEEERNKIDVFKRELPLCMLLLNEEIVFLCVAIGALKDEARKGLSLMASNGKFDDVERAKPETDKKSWMSSAQLWISNPNSQFRSTNEEEEDRCVSQNPFQTCNYPNQGGVFMPFNRPPPPPPPAPLSLMTPTSEMMMDYSRIEQSHHHHQFNKPSSQSHHIQK

8、KEQRRRWSQELHRKFVDALHRLGGPQVATPKQIRDLMKVDGLTNDEVKSHLQKYRMHIRKHPLHPTKTLSSSDQPGVLERESQSLISLSRSDSPQSPLVARGLFSSNVGHSSEEDEEEEDEEEEKSDGRSSCRNDETKKKRQVLDLEL蛋白质一级结构分析ProtParam(/protparam/)蛋白质序列太短?没有得出结果ProtScale(/protscale/)应用ProtScale绘制拟南芥蛋白序列的亲疏水性序列谱,使用的氨基酸标度(amino a

9、cid scale)为Hphob./Kyte & Doolittle算法(默认值),该算法通过已知的20种氨基酸的亲疏水标度定义蛋白质序列的亲疏水性,score(分值)0表示亲水性,score0表示疏水性,其中score1.5表示高疏水性。窗口尺度(window size)为9。蛋白质二级结构分析PSIPRED(http:/bioinf.cs.ucl.ac.uk/psipred/)应用PSIPRED预测拟南芥蛋白序列二级结构,下面为图形分析结果。图中,C代表无规则卷曲,用横线表示;E代表折叠,用黄色箭头表示;H代表螺旋,用粉色圆柱体表示;Conf.表示可信度(confidence),用蓝色方柱

10、表示,柱体越高,说明可信度越大;Pred.表示为预测的蛋白质二级结构。COILS(/software/COILS_form.html)应用COILS预测牛ARF1蛋白序列的卷曲螺旋(coiled-coil)。卷曲螺旋区域一般是由abcdefg等7个残基(heptad)为单位,因此窗口宽度(window width)一般为7的倍数,如14、21、28。默认选择全部窗口搜索,矩阵(matrix)选择为MTIDK(默认值),结果可见6个卷曲区域(score0.1),位于150-200,220-280,300-400,420-450,500-530,600-650。蛋白质三级结构分析Pfam(/search)应用Pfam对拟南芥MYB蛋白进行结构域分析,结果与Pfam-A数据库有3个结构域家族匹配。InterProScan 4(http:/www.ebi.ac.uk/Tools/pfa

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论