生物信息学论文汇总_第1页
生物信息学论文汇总_第2页
生物信息学论文汇总_第3页
生物信息学论文汇总_第4页
生物信息学论文汇总_第5页
已阅读5页,还剩4页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、生物信息学论文学院:生命科学技术学院专业:生物科学班级:2013级老师:高亚梅学生:王秉政学号:20134083038黑曲霉GH75及米曲霉GH76-5基因生物信息学分析王秉政(黑龙江八一农垦大学,生命科学技术学院,2013级生物科学专业,黑龙江省,大庆市)【摘要】目的:分析和预测黑曲霉GH75和米曲霉GH76-5基因及其编码蛋白质的结构和特征。方法:禾U用NCB太CBS和ExPAS那站中的各种信息分析工具,并结合VectorNTIsuite8.0生物信息分析软件包,分析预测黑曲霉GH75和米曲霉GH76-5基因并预测该基因编码蛋白结构的特征和功能。结果:GH75基因全长174bp,编码区具有

2、57个氨基酸,在GenBank同源序列中,其与AspergillusnigercontigAn04c0140,genomiccontig基因氨基酸序列一致性达到100%,且有GH75保守域。GH75蛋白相对分子量预测为26257.2,理论等电点为4.69。预测GH75编码蛋白a螺旋(H)、3折叠(E)、无规则卷(L)的比例分别是11.07%、25.41%、63.52%,1个GTPase结构域。GH75蛋白为亲水蛋白,有跨膜区,有信号肽。GH76-5基因全长309bp,编码区具有102个氨基酸,在GenBank同源序列中,其与AspergillusnigercontigAn14c0130,gen

3、omiccontig基因氨基酸序列一致性达到100%,且有GH76-5保守域。GH76-5蛋白相对分子量预测为46029.3,理论等电点为5.28。预测GH76-5编码蛋白“螺旋(H)、3折叠(E无规则卷(L)的比例分别是26.90%、20.71%、52.38%,2个GTPase结构域。GH76-5蛋白为疏水蛋白,无跨膜区,无信号肽。结论:成功预测GH75和GH76-5基因及其编码蛋白生化及其结构特征,为下一步对其进行克隆和表达奠定基础。【关键词】黑曲霉、米曲霉;糖基水解酶家族(GH75);糖基水解酶家族(GH76-5)生物信息学黑曲霉是一种重要工业微生物,在酶制剂、异源蛋白、有机酸等领域应用

4、广泛。2007年黑曲霉基因组的公布将黑曲霉的研究引入后基因组时代,各种组学数据如雨后春笋般涌现,人们对黑曲霉高效生产机制的理解上升到系统、分子层次;与此同时,黑曲霉遗传操作系统也不断成熟,为系统地研究和改造黑曲霉、将黑曲霉打造成通用细胞工厂奠定了基础。米曲霉是一类产复合酶的菌株,除产蛋白酶外,还可产淀粉酶、糖化酶、纤维素酶、植酸酶等。在淀粉酶的作用下,将原料中的直链、支链淀粉降解为糊精及各种低分子糖类,如麦芽糖、葡萄糖等;在蛋白酶的作用下,将不易消化的大分子蛋白质降解为蛋白月东、多肽及各种氨基酸,而且可以使辅料中粗纤维、植酸等难吸收的物质降解,提高营养价值、保健功效和消化率,广泛应用于食品、饲

5、料、生产曲酸、酿酒等发酵工业,并已被安全地应用了1000多年。米曲霉是理想的生产大肠杆菌不能表达的真核生物活性蛋白的载体。米曲霉基因组所包含的信息可以用来寻找最适合米曲霉发酵的条件,这将有助于提高食品酿造业的生产效率和产品质量。一、资料与方法1.1 资料通过ExPASy数据库的UniProtKB(或/uniprot)获得黑曲霉的GH75与米曲霉GH76-5基因序列。GH75基因编号为4990860.,NCBI的登录号为XM001401782.1.,其他物种的GH75的氨基酸序列均来自Genbank,登录号见图1。GH76-5基因编号为4

6、987208.,NCBI的登录号为XM_001400940.2.,其他物种的GH76-5的氨基酸序列均来自Genbank,登录号见图2。1.2 方法利用美国国家生物技术信息中心(NCBI,)的基本局部比对搜索工具(BLAST,/blast/),运用Blastx完成基因同源性分析。应用ORFfinder(/gorf/orfig.cgi)寻找其开放读码框,并推导出可编码蛋白序列。利用保守结构域(/Structure/cdd/wr

7、psb.cgi)分析预测其保守域。通过瑞士生物信息学研究所的蛋白分析专家系统(ExPAS)所提供的蛋白组学和分析工具:Protparam程序分析GH75及GH76-5蛋白氨基酸组成、相对分子质量、等电点等基本理化性质;TMHMM程序预测GH75及GH76-5的跨膜区;Proscale程序分析GH75及GH76-5的蛋白性质;SignalP程序预测GH75及GH76-5蛋白的信号肽,GOR超链接分析GH75及GH76-5的二级结构,SWISS-MODEL!过二级结构比对和折叠,模拟蛋白质的空间构象。利用SMART(http:/smart.embl-heidelber

8、g.de/)分析预测其结构域。二、结果2.1 基因序列的分析BLASTx分析结果表明,GH75与多个物种的GH5基因同源,其中与AspergillusnigercontigAn04c0140,genomiccontig的同源性最高,一致性达100%,相似度达99%(图1)。ORFFinder获得其开放阅读框编码氨基酸序列,1基因全长174bp,编码区为2-174bp,编码57个氨基酸,无起始密码子,终止密码子TAA,不编码蛋白(图3)。CCD分析发现有GH75保守域。BLASTx分析结果表明,GH76-5与多个物种的GH6基因同源,其中与AspergillusnigercontigAn14c0

9、130,genomiccontig的同源性最高,一致性达100%,相似性达100%(图2)。ORFFinder获得其开放阅读框编TotalEEC4PBscareaov&fvAie13581加篝00100%即|皿1刈仃8”E为1173WO%弟为aHEMffiJ码氨基酸序列,该基因全长309bp,编码区为1-308bp,编码102个氨基酸,无起始密码子,终止密码子TGA不编码蛋白(图4)。CCD分析发现有GH76-5保守域。D66-£riplififllJAikrgM11gpisrGR台51工刖miairnsB.eR时A图1BLASTxAfihibeei乱1小毛皿沁附Max守ex

10、i士函。Ou*(yEvAlmiiAccdrfraIOflAAgraiiiu占mci,C:iBW姓ann口mggfihas»erF&taEHY.mRMAM胸3右6。ic30001。中餐XJM0口1。0口融旧口maarcomai«:OiiM.gnomicc=an>a帕帕安加他阴治。屯MD*AJM77Dll7aH口Pa<iic>ii«jn!rviarnc-ficiftTOC1$224hv<lrcii3-54.mRN31«-3£kmoa?iisairnT-ftiDFFT1y<4E.HDHBhrf-ATM10弓0口灯

11、1¥001芋iHV血血,V.皿1口口丫廿HPNAl&l161工珠工XMaQ7477a3J-1DeraiHu?cjrvzjie,RiS-10tnoflrr.nriano5e.cjH?(ilarvwv,pRNA71371J:KM门口ITNTBJhNeraillu?Jlaviis-MRRL3-357mannan-en4o-l.C-alohaminnpsifliE.pdcwiixecursor.ixjlqye-.mPHA7137132%7MB粘£km口NnaqaiTRi治西网1川5wvEDe1诵y/tmmq5Baue*ico.AgESJODSH713713工藤9sM川mmi

12、iiflKMrallluRQCKuKjjMQUUuJSUlfi67B676*479SKaRub,11图2BLASTx1T5aatlyccyswasCnt灯曲tmcbcrthhcbdcnkcskchc明HXXXLXXXXXKXXXR130ttstcawscctdicwcrncgbbbkbswkchyhrhancbbrdntKhXEXLXXRXXXXXXXX85crssbhjnsahshrcgjiccdsntchghhknhrycc鸣dsmnshs空xxxxxxxsxxxxxxx40aashanchdcatdgjnsmdmiirtehsrtata2XXXHXXXXXIKXX图3ORFFinder3

13、09ssseaybamlfcHckntKcatskcetKcrcKbrwrhacseegctXIXXXXXPXXXTXKA2S4ttrh1s.*Ldyhbmix."blstixtsrliysrcmsykRuigKilctdrkhK*.sxunxxxxxxxxxxxxxxx219bNcn.ssymayhawmbiitcasntkb11crarcsrssad11sbhsXXXXXXSXXSXXXKX174ignmtsstch.brrrii.cac3twhwbmntwbrancaytytsccnsbtiumrXXSXXXXXXXIXPXX129Keimstwycengsahwystsdin

14、wncrchsyny111bacwthhuccXXXXXXXKXXXXTXX84tdlskKhcttbtfttrnmhir&dKeardxrkksckktctKhbhXXXXIXXQXXXSXXX39hacmrskutitamt"bEbsaasshKimctsstitimbsinbyk1图4ORFFinder2.2 编码蛋白的特征分析2.2.1 蛋白质的基本参数GH75蛋白相对分子量预测为26257.2,理论等电点为4.69,脂肪系数为75.94。在溶液中的不稳定系数是25.26,为稳定蛋白。当蛋氨酸在N端时,可预测其在哺乳动物网织红细胞(体外)中,半衰期均30小时,在酵母(

15、体内)中,半衰期大于20小时,在大肠杆菌(体内)中,大于10小时。氨基酸的组合物(图5),原子组成(图6)。带负电荷的残基总数13,带正电荷的残基总数27。当蛋白浓度为1g/L,所有的半胱氨酸残基形成半胱氨酸时,吸光指数(ABS)为1.629,在水中280nm摩尔消光指数为42775;所有的半胱氨酸残基不形成半胱氨酸时,吸光指数(ABS)则为1.615,在水溶液中280nm摩尔消光指数为42400。总的亲水性平均疏水性指数(grandaverageofhydropathieity)为-0.204,预测为亲水蛋白。GH76-5蛋白相对分子量预测为46029.3,理论等电点为5.28,脂肪系数为6

16、4.67。在溶液中的不稳定系数是27.19,为稳定蛋白。当蛋氨酸在N端时,可预测其在哺乳动物网织红细胞(体外)中,半衰期均30小时,在酵母(体内)中,半衰期大于20小时,在大肠杆菌(体内)中,大于10小时。氨基酸的组合物(图7),原子组成(图8)。带负电荷的残基总数33,带正电荷的残基总数42。当蛋白浓度为1g/L,所有的半胱氨酸残基形成半胱氨酸时,吸光指数(ABS)为1.970,在水中280nm摩尔消光指数为90675;所有的半胱氨酸残基不形成半胱氨酸时,吸光指数(ABS)则为1.962,在水溶液中280nm摩尔消光指数为90300。总的亲水性平均疏水性指数(grandaverageofhy

17、dropathieity)为-0.323,预测为亲水蛋白。Aainoacidcnpositim;-7%2.OK49%8.23S2国2感2脚11.般3.3K4.5K9微3.州2.OS17%4,服8.2%3.6%2.0%4.9%0.0%0.0%0.0%0.0%0.03SIB/XBBJ-hl/-T1J-IB/IB/LKT/ARMDCQEGHILKMFPSTyYyou/lyJII1IJJLi.JJLl.1JIU.,/L%.rrk.JJLb.JJLt./ll>/Li.Hfx-JJLl./i/L*JJLVJJLX.JII1I/Li-JJLL.1JIU.la兆热即警IrLlulylsle电展的hero

18、erhrrp再dylecaaaacggghillmppstttvfsJ45122069122021510120图5氨基酸组合物物图6原子组成Atmiccoqnsition:CarbonCHydrogenHNitrogetiNOxygen0SulfurS图8原子组成解niccaosition:2068166o61I1-3CarbonC2039HydrogenH3UT£NitrogenN544Oxygen0C36SulfurS2042133.1%184.3%317.4%7L7M225,25(n2,捐363.6%T1.7%E321图7氨基酸组合.ux204.3%133.1%194.5%15

19、3.65(419,眺犯T.13f112.535204邢20工跳00.05(00.0KAnunoacidcaositim:A.r.LI.1.1111hlrr11r11.7.!Ju.hkIYJJ.Ir.A.JI.Mil.IhsA.I1IARffDCQEGr工LKKFPSTvFVOlrrlrDXrl-JBXfv(fl/Irlret-fl(fl.flrnfi-fl-rL(-t-la曜sn即第Inlulylsleeuysethemerhr卬"alylecAAAACGGGHILLMPPSrTTVPSFoaula:Q侬后的隔曲磔11Totalnunbercfatoms:3GOT0口,明(Z)QCK

20、)00.03SFoonla:如3驰窕q觎Totalrmnbeiofatons:63172.2.2 疏水性分析、跨膜区分析TMHMM预测GH75蛋白,提示有跨膜区,位于膜内(图9)。Proscale分析疏水性,结果也提示GH75为亲水蛋白(图10)。SignalP分析提示GH75有信号肽(图11)。TMHMM预测GH76-5蛋白,提示无跨膜区,位于膜外(图12)。Proscale分析疏水性,结果也提示GH75为疏水蛋白(图13)。SignalP分析提示GH76-5无信号肽(图14)。i.N<h4ar-曰.L,七IIE1E上工0工1MMMM53,一I*WIr3I:-3444JtrOIJ-Xw

21、nirismrTT3II:.J.I!r.l'.I-.1I:ifl-C*-MII-rTJ'ASTMIMMB-nOfi.rK-lorrokilrl-nfo曰m巨工工匕i耳二后图12TMHMMUsingihe导口I皓Hph*1Kyle&口因时鹏Hieindgidu承Ivalues即小已20amingadds日用fSignilKLnkpndnlim41阿Glu:-3.500Iflct:1”COTyr-1300Ar窜7为口激y:-0.400Ph:2.SOD闻4200Waightstorwindowpasmons1,.J.usinglin«3rw冷Mvariatianmc

22、Mfel:234S67S1QDi.DO1.009.001.001口口|.DQ1.003.00电Weec*nteredgetleUIHifuLlilfikilC器bizI25tn5E班武51-ItD1明V&lufeCie.offEipil0.2Kn耀0.950073Q611。啊ns丁睢百窜小酹'口科jtisitibitimpa占425:M5-U时611卜闻戒=0.醺6口过FhJI图10Proscale图11SignalPthemdimduBUvaluestorVieammosodsareAlIL:L皎讪毛:-45D0AinT90Gix61f叩Kal:T200Mt:LOTPbc:F

23、e:-16C0I”:-L.300Vsl.<.300:-3.500Usingth&±caleHphob.!KyleftDoolrtlle帆:-J500Cys:25fl0nt;4.nolh,;3eoo5er:-D'BWThr:41.TW)-3.50:-0.4WLn:f5MLn;7W0Trp:-c.mSSignalP_4.1eulspredictiioiiiE)Seqo史iutcW&ighlsftsrwindow口髓用囿手1.9,usingliiwarweightwtiiiaomodiel.1234561&1.DOLOO1.D0L.DOLOO1CO1.

24、001.QCLOOndfrCAH14f*dg白Sgng-S1pr«|idKnvukngtwpli)Sewmc事#MeasureFositionValueCutoffsiaalpepIida?maz.C420.147maa.I200.186mai.S50.317meanS1-190.262D1-190.2273.450ROI:=me=SequenceSP='HTD=D.22TD-cutoff=D.450Networks=SignalP_noTWSetjuencekngth:Z441Ml制34皿皿WMIIll'l加MM”lllllllIIHIinlHillIlliIII刎

25、m刖|图17Dmoleculeviewer2.2.3二三级结构与结构域SMART预测可能存在1个小GTPase结构域(图15),GOR预测GH75编码蛋白二级结构中螺旋(H)、折叠(E)、无规则卷(L)的比例分别为11.07%、25.41%、63.52%,以无规则卷为主(图16)。SWISS-MODEL模才GGH75三维结构,应用vectorNTIsuite软件包Dmoleculeviewer显示蛋白质三维结构(图17)。SMART预测可能存在2个小GTPase结构域(图18),GOR预测GH76-5编码蛋白二级结构中螺旋(H)、折叠(E)、无规则卷(L)的比例分别为26.90%、20.71%

26、、52.38%,以无规则卷为主(图19)。SWISS-MODEL模才GGH76-5三维结构,应用vectorNTIsuite软件包Dmoleculeviewer显示蛋白质三维结构(图20)。ClicktoHlth>startofUisirvgion.kvlarnuftanDritiul淅Lwwth244U4a4alM5eUniPwiknttnervAKJt33_A3PNC.WH93图15SMART1020M4D5D60叩IIIIIIIFfflLlTTLtLSIlTTintLAIATSMHL弛IRK需空JUHLAJ的璇窿。0m无圆二缠£peeeeeoccceeeeeeeccccc

27、ccc:Nihhcaoc-crrccc-zzcccorr-crcceeee一旧丽侪GMWI力通SHG海片氏5KBQTSFKDL网步工PtO朗IHFTMGmmetBKCCcccc:cccee&eccee(xccccccECCCceccccacccccccccdKCcccoeeeecccoccPQKIEWFLSWJijTO湖LF%函D加罚5拓EASIiUKIfFP而物的而IXEYIW砥:j.lLi.:eeM«eeea.:i.:,etectteee:.ucMWiWiitHii,.一一二泥蛇.一匚E的S加睚:如SHEFEE5出山第町地HIeeehHihEhhHnhhhruB&

28、e图20DmoleculeviewerInlrnigbQAOnJiN烟LenQHl42D口口UnlPnOilHflMiwaQTRuCl-NEUCRQTRvCl图18SMART1020304060i60i70fflmWKP触MI5LIS4GITKHDISSTTWQS的眄nBFYKGTM)星即LDAPi注GAN:_ee-hhhhihW'i?i-hhl此此上同岫:日£匚:eeeeeeeeeeeeeee用,MLUYSHYT5HHM(KIATAH旧居印和而俎此俄&刖gEJFTVUAAEfflFFQFESDIB!M«i»KGcc7bhhhhlih)Thhn:.

29、cr:cGirEGGg:二w:hhhhHdhHKHMBEccoc.用肛ELGEH出KSLISiT找二4LWijlFAEHPK)工口TKNATSMFFQ.EAEL犯ITGWWYVEWl匚口M#匚匚hHhH?B键匚匚rc&tSTrrttCttrc口;白匚:httdhhHhihhheeeee胸而叮5居LI屈汪EUQ空&B:S右幽近陷困西蟠无门GAMBWISTi;皿腌叮访e般能上Hhhhhhe亳典hFWhhhhhhhhhKBLLES次府TPFGD后皿叫脏E脏:EHIDICHTWESfKG近踊比EKmTSlUOTiRLLHThlh?hhh?hheeeee:eeee«hhhhhh

30、Sequaturelength342Q图江瓶峥:颗$WTftZTKV5霞口叫LGKjMMl口第ILIDQAlFrLIEM)口:丽F5SS1hrtiihKheeeeee&EeeWihhtiHihhiihhh日zeeeeeeeee三、讨论GH75基因全长174bp,编码区具有57个氨基酸,在GenBank同源序歹U中,其与AspergillusnigercontigAn04c0140,genomiccontig基因氨基酸序列一致性达到100%,且有GH75保守域。GH75蛋白相对分子量预测为26257.2,理论等电点为4.69。预测GH75编码蛋白a螺旋(H)、3折叠(E卜无规则卷(L)的

31、比例分别是11.07%、25.41%、63.52%,1个GTPase结构域。GH75蛋白为亲水蛋白,有跨膜区,有信号肽。GH76-5基因全长309bp,编码区具有102个氨基酸,在GenBank同源序列中,其与AspergillusnigercontigAn14c0130,genomiccontig基因氨基酸序列一致性达到100%,且有GH76-5保守域。GH76-5蛋白相对分子量预测为46029.3,理论等电点为5.28。预测GH76-5编码蛋白a螺旋(H)、3折叠(E卜无规则卷(L)的比例分别是26.90%、20.71%、52.38%,2个GTPase结构域。GH76-5蛋白为疏水蛋白,无

32、跨膜区,无信号肽。结论:成功预测GH75和GH76-5基因及其编码蛋白生化及其结构特征,为下一步对其进行克隆和表达奠定基础。木质纤维素是地球上资源最丰富,对环境友好,潜力巨大的可再生资源,通过生物方法对纤维素进行降解转化是纤维素利用的一种绿色环保的方法。但在纤维素的生物转化过程中,纤维素酶的使用占成本的比例较高,也是木质纤维素大规模利用的主要瓶颈之一,因此需要快速、高效地筛选纤维素酶特别是来自极端环境生物的纤维素酶,以寻求酶活高,热稳定性好,能适应极端pH环境的纤维素酶。纤维素酶是多组分酶,包括内切葡聚糖酶,外切葡聚糖酶和3葡萄糖甘酶,纤维素的水解是这三个组分协同作用的结果。其中内切葡聚糖酶作

33、用于纤维素降解的第一步而尤为关键。内切葡聚糖酶最早发现于赐牛的消化液中,之后对来源于真菌和细菌的内切葡聚糖酶进行了深入的研究,且发现内切葡聚糖酶多数来源于细菌。内切葡聚糖酶(EC)又称为接甲基纤维素酶、Q酶等,分子量大小在23-146kDa之间。内切葡聚糖酶主要作用于纤维素的非结晶区,随机水解口-1,4-糖昔键,将长链的纤维素截短,对纤维素的整体降解起到了重要作用.所以利用基因工程的方法,通过内切葡聚糖酶与外切葡聚糖酶或葡聚糖甘酶的复配协同作用,可以有效地降解结晶纤维素在纤维素酶系中,内切葡聚糖酶作为首先作用于纤维素的第一个酶而尤为重要。内切葡聚糖酶作为纤维素酶的组分之一,也是典型的模块化酶。纤维素结合域(CBM)通过增加纤维素酶在底物表面的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论