小鼠EDNRB基因启动子生物信息学分析[1]_图文_第1页
小鼠EDNRB基因启动子生物信息学分析[1]_图文_第2页
小鼠EDNRB基因启动子生物信息学分析[1]_图文_第3页
小鼠EDNRB基因启动子生物信息学分析[1]_图文_第4页
小鼠EDNRB基因启动子生物信息学分析[1]_图文_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第9卷第1期 2O 11年3月生物信息学CIlina Jo哪al of Bioir南mI撕csVoI.9No.1 Mar.2011doi:10.酬.i蜘.16725565.2011.01.018小鼠EDNRB基因启动子生物信息学分析1张万里1,李伟1,吴川清1,林学科1,李航1,王国斌1,陶凯雄H(华中科技大学同济医学院附属协和医院普外科,武汉43吃摘要:EDN砌yEDN3/ECEl信号传导通路在胚胎发育期神经嵴细胞分化、迁移、发育为神经节细胞的过程中起到关键作用。采用 进化足迹法,利用生物信息学在线软件分析先天性巨结肠相关EDNRB基园启动子序列,结果显示:小鼠EDNRB基因定位于14号染

2、色体,编码442个氨基酸,分子量为:49430Da,转录起始点300bp左右可能为启动子区域,启动子区域包含长度为1473bp的CpG岛,存在两段保守序列,人类和小鼠保守区域内含有33个共同的转录因子结合位点。关键词:E咖;启动子;生物信息学;转录因子中图分类号:Q5培.2文献标识码:A 文章编号:16725565(2011一01一072一c15oiIlf:研m撕cs Analysis 0f M|0u孵ED】岍m G叫e PI.0I瑚眈r Regio璐zH心G wall.1i1,u weil,w1J cI啷.qill91,uNe.ke。,u Harl91,WANG Guo.binl,TAo K

3、ai.xio耐 (肌妒咖柳旺矿酬鼠rgl!,y,所锄舶咖f,孙唧胁成谢嘶旷胁咖妙矿删强炯咖y,4300趁,醌妇Abs咖ct:EDNRB/EDN3/ECEl si酬illg pam、va,plays锄iml埘t鲫t mle in dle di瞻reIltia咖n and rIli鲫ion of rleu-Ia:I c陀st ces t0f0n gaIlgLion cells幽I玛eHlbryoIlic develop腿nt.O|lliIle bioi幽m嘶c8t00ls and pbylogenetic f抽t一 面nt吨were used to锄ly舱Hirsclspmngs diase鸽so

4、cia州EDNRB genes pm啾er.1he resuhs showed tIlat mouse EDNRB ge鹏w嬲删巾ped to chn加0some 14,枷ch encoded a pmtein c0璐i8tillg of z弭2a而noids而th a Il净kularweight419430Da.300bp踟und h锄scri面orlal st缸site r啦灿be p删lloter嘲on8,which included a CpG i8land with a lengtIl of 1473bp.The p埘mter rj晒0ns Ilad hcon眈n,ed selqu

5、enc朗,尚ch contained 33朝IIle咖s耐砸oflal f抽tor bindirlg sites.Key帅rds:EDNRB;弘砌0ter;bioi幽硼撕cs;觚1scdptional&tor先天性巨结肠(HirschspmIIgdisea跎,HD是一种 受环境与遗传因素共同影响的神经嵴细胞源性多基因 性疾病,其发病机制为患儿在胚胎发育过程中,遗传因 素和环境因素造成神经嵴细胞分化、迁移、发育障碍, 肌层和黏膜下神经丛的神经节细胞缺如,导致受累肠 段异常收缩,近端肠段代偿性扩张与肥厚。该病与环 境因素和遗传因素相关,其中环境因素起着更为重要 的作用.目前已发现内皮素B受体(er

6、ld础出n receptor 唧e B,EDNRB和砌强等10种基因与HD发病有关.在所有HD患者中EDNRB基因突变作为病因约占5%一lO%,在肋致病病因中仅次于RET居第2位J。 EDM诳基因编码一种G蛋白偶联受体,在生理情 况下定位于细胞膜,属于G蛋白偶联受体超家族.配 体内皮素(明domehn,阻结合,通过细胞内ca2+磷 脂依赖性蛋白激酶第二信使系统将信息传人细胞内, 促进内质网和肌浆网钙储库内Ca2+迅速释放,胞质 内Ca2+浓度迅速升高忙J.胚胎发育过程中,EDNRB/ EDN3/ECEl信号传导通路在神经嵴细胞迁移发育分 化成神经节细胞时候扮演着重要角色,对结直肠肠神 经系统形

7、成不可缺少”J。目前在NCBI的GenB肌k数据库中未记录小鼠 EDNRB基因启动子序列,本研究利用进化足迹法和 生物信息学的研究方法,从NcBI中筛选出可能的启 动子序列,同时对其转录调控元件和核苷酸序列的同收稿日期:2IDl0一01一;修回日期:2010一一.基金项目:国家自然科学基金资助项目(30嗍。作者简介:张万里,男.博士研究生,EmiI:日muJ呲ke国脚m.咖.明.通讯作者:陶凯雄.男,主ft医师,博士研究生导师,EnniI:ta0lai菇衄g163.第l期 张万里,等:小鼠EDNRB基因启动子生物信息学分析173源性、染色体定位以及保守结构域转录因子结合位点 进行分析,为进一步

8、研究EDNRB基因的基因调控功 能奠定基础。1材料与方法1.1材料1.1.1小鼠EDNRB基因序列和基因组结构该基因GeneID:13618,定位于14E2.3负链,基 因跨越29071bp,含有7个外显子、6个内含子,转录 mRNA的ID号NM!D07904.3,编码蛋白质产物含有 442个氨基酸,分子量为49430Dalton,该基因尚未记 录启动子序列。1.1.2程序和数据库在线核酸序列数据库:http:/www.ncbi.IdIll. /genbank/J宁列对比BLASTN:http:/blast.ncbi.nlIll.nih. 昏代,启动子在线分析软件:Promote

9、r 2.0http:/www.cbs.dtu.dk/seices/ Promoter/NeuraJ Ne啪rk Pro啪ter PI.edicti彻:http:/玳哪./8eq-tools/promoter.ht mlPmnloter SCAN:http:/wwwbimas.cit.nih.90、,/molbio/prosc龇FillstEF:h郇://tools/FillBtEF/转录因子预测软件:PMatch 1.0:www.generegI biIpub/pmgram&/pmatcIbim,pmatch.cgi 两序列间保守区域转录因子结合部

10、位预测软 件:Csite:http:/asp.ii.uib.肿:8090/cgibin/ CONSll哑yconsite/CpG island预测软件:http:/cpgislands.岫c. edu/1.2方法1.2.1获得人类和小鼠EDNRB基因序列 在h即:/们nv.血bi.nlI/geIIb粕k数据 库中检索EDNRB获得人类和小鼠EDNRB基因ID 分别为13618和1910,采用GeneBaIll格式获得基 因信息。1.2.2EDNRB基因启动子序列的确定在NCBI的GeneBank中查找,获得人类ED NRB基冈的转录起始位点在基因序列图上的定位, 并获取转录

11、起始点上游3000bp至下游l 000bp的 5侧翼序列。该序列包含潜在的启动子序列。 1.2.3利用上述在线启动子分析软件进行预测 采用在线启动子预测软件在默认条件下对取得 EDNRB基因序列进行预测分析。 一1.2.4人和小鼠启动子区转录因子结合位点分析 选用PM批h1.0程序,核心序列相似性(co弛 simil撕t,设为0.75,矩阵相似性(nI撕x similaritr 设定为0.80,输入EDNRB基因上游3000bp,搜索 认NSFAC position weight matrix(PWM数据库中 的脊椎动物转录因子结合部位,获得该基因启动子 转录因子结合结果,然后将人和小鼠EDN

12、RB基因 5端上游4001bp,同时输入Consite程序中,获得两 者之间的保守区域,并搜索位于两个序列保守区域 相同位置的转录因子结合位点,其余的结合部位作 为假阳性而被去除,该方法明显的降低了假阳性率, 提高了预测的准确度H。1.2.5EDNRB基因启动子CpG岛分析按照儆ai.et al1对cpG岛的定义和算法分 析预测。2结果与分析2.1小鼠和人类EDNRB基因启动子定位小鼠和人类EDNRB基因位于不同染色体上, DNA序列长度均不同,具体结果见表l。表1人类、小鼠EDNRB基因启动子在基因组序列凰上定位 1铀Ie l I栅】i盟Iion 0fMou蹰d hu姗s EDNRB in

13、ge鹏2.2小鼠EDNRB基因启动子预测结果由表2可知不同的在线预测软件具有不同的预 测准确性,小鼠EDNRB启动子序列理论上应分布 于转录起始点附近,通常确定启动子的算法可以分 成两种,一种根据启动子区各种转录信号,如TATA 盒、ccAAT盒,结合对这些保守信号及信号间保守 的空间排列顺序的识别进行预测,但其预测的假阳 性率较高,PROM01lER 2.0每23kb出现一个假阳 性;PROMOrIER SCAN平均每19kb出现个假阳 性哺j。另一种方法根据启动子区序列的特征进行 预测。Fi玛tEF搜索通过5uTR定位技术构建的第 一外显子数据库,识别第一剪切点,结合cpG岛信 息,确定启

14、动子区。这种方法使预测的敏感性和特 异性都明显提高。该程序预测含epG岛的启动子 的敏感性和特异性都高于90%,预测不含cpG岛74生 物 信 息 学 第9卷的启动子的精确性相对略低71。结合这些因素考虑,FirstEF预测的启动子位点可能性很高,但有待于后续试验进一步证实。表2EDNRB基因启动子预测结果Tabk 2Prediction reslll协0f EDNRBs promoter启动子预测软件 预测结果Pmmoter2http:/www.cbs.dtu. p08ition 酞elih00ddk/serviIeP-叫no【el/12 O.6321000.7272500O.6463000

15、O.592370【】o O.596Neu豫l Ne呐rk Staft EndPIDmoter Predictionhttp:ww.fmimy.o形seq-4404190tooIs/p阳moIer.htlIlI1048 1058 2834 109811082884MargiIIal pmdic6 Ma晒n pr;edicti MarginaI pMliction MarginaI prediction Margiflal predic60n Scom0.83 1.00 O.8029653015O.97 Pmmoter scAN p埘not髓le画衄s whep砌cted 嘶:/wwwbim.ci

16、/molbio/p瑚cFirstEF St眦 End score !业;么璺些:塑丝:型塑芝堕翌!竖:!1212j鲤 Q:!i12.3EDNFuB基因启动子区域转录因子结合部位分析 经PMatchl.0程序搜索TRANSFAC 6.0数据 库,获得小鼠EDNRB基因启动子转录起始点上游 3000bp正负链转录因子结合部位共计631个,再用 进化足迹法分析,利用Consite程序确定人和小鼠 同源基因保守区域见图1和图2,只保留位于保守 区域内共有的转录因子结合部位33个(表3.人类 在20002400bp和2800一3800bp处为可能的保 守区域,小鼠的保守区域为22002

17、400bp和30003700bp,在转录起始点上游一25一30bp处无 TATA框(TATA b似,和典型的真核生物启动子序 列结构不同。互补链上游一102bp存在可能的 CAAT框(CAAT box,在上游还含有可能的TATA 结合蛋白因子、AT结合转录因子等结合位点,结合 相关文献报道,推测该序列可能含有编码其它蛋白 质序列的转录起始点。图1人类EDRB基因启动子保守区域分析Fig.1A衄lysjs of Hunlan EDNRB8con鸵“ed regi帆图2小鼠EDNRB基因启动子保守区域分析Fig.2Analy8i8of M叫卵EDNRBB conwed fegi帆l仅l-.-+_+

18、_.+_l廿卜-+斗2400_ CDGlsland 1240l卜卜+斗.卜卜卜卜+件+斗+斗卜+卜+-+-+书+一.+一3200select I洲钟*mi协:%GC=55.ObsC阚CpG=0.65.LengIh:500.Di嘲nce:100 CpG IsIand 1铂船2213.end=3685。%GC=53.4.obsCpG脚CpG=0.678,L鲫鲫=1473豳3小鼠EDNRB基因启动子CpG岛分析结果Fig.3Re8ults of Mouse EDNRB pmmoters Cp(;IsI绷d注:直横线为EDNRB基因启动子序列,竖线为CG位点。粗横线表示CpG岛第l期 张万里,等:小鼠

19、EDNRB基因启动子生物信息学分析1752.4启动子CpG岛预测CpGIsl觚d Searcher【81对小鼠EDNRB基因启动 子分析发现该序列存在22133685bp长度为1 473bp的CpG岛,G+C含量为53.4%,CpG观察 值/预测值为0.678,该区域表观遗传学改变可能对 EDNRB基因的表达调控起到重要作用,对该区域的 研究有助于揭示先天性巨结肠的发病机制一J。详 见图3。3讨论采用进化足迹法,对EDNRB基因启动子序列 进行分析,获得了较为准确的启动子序列信息,通过 搜索rrRANSFAC6.0数据库,发现人类与小鼠ED NRB基因存在两段保守区域,Consite进一步分析

20、筛 选出其启动子保守区域共同存在的转录因子结合部 位(昀nscriptional factor binding site,这种方法降低 了假阳性率,使得预测结果更为准确o。采用各种在线启动子预测工具对小鼠EDNRB 基因潜在启动子区域分析,发现在转录起始点上下 游300bp为可能启动子区域,该区域不存在真核生 物典型的TATA框,存在可能的CAAT框结构,该区 域可能存在编码其它蛋白质产物的不同转录起始 点。结合生物信息学与进化足迹法人类和小鼠ED NRB启动子保守区内预测存在33个共同的转录因 子结合部位,和目前报道的人类EDNRB基因启动 子区域存在CpG岛一致,小鼠也存在该结构,这些 生

21、物信息学预测为探索EDNRB基因调控机制和构 建特异性启动子提供了研究方向。由于数据库搜索 分析知识在序列中对已知位点进行查找,而那些未 知的新的转录因子结合部位则不能通过这种方法进 (下转至第81页第l期 乔 辉,等:阳离子一叮r相互作用在两种典型蛋白质折叠型中的偏好性 81(上接第75页行分析,同时由于真核生物之间存在特异性和预测软譬曼理旱限性,该在篓存在极大不足,这些分析结 3果有待于实验进一步验证。4结论小鼠EDNRB基因位于14号染色体负链,含有 29025bp,转录起始点上游为可能的启动子调控区 域,启动子不存在真核生物典型的TArA框。启动 子保守区域内和人类共同的转录因子结合部

22、位有 33个,和人类启动子具有同源性。转录起始点上游 存在长度为l 473bp的CpG岛,GC%=53.4%,Ob-sCpG/ExpCpG=0.678,该区域横跨转录起始点至第 一外显子,DNA甲基化、组蛋白乙酰化等表观遗传 学机制通过对该区域的调控,控制EDNRB基因的 表达,在先天性巨结肠、黑色素瘤等相关疾病发生机 制中扮演重要角色。参考文献(References:【1张万里,王国斌。陶凯雄.内皮素B受体基因与先天性巨结肠 关系的研究进展J】.世界华人消化杂志,2009,17(25:26072611.2Nak砒8uji T,Leiri s,M删mot0K,Akiyhi J,Tagllchi

23、 T,su妇 45678910】S.Irl仃eUIll盯calcium lllobili翻畸0f the删i彻ic i曲8tiin tIIe衄d讪elin B哪genedeficient mtj.J Pediatr surg, 20cr7.42:1663一1670.Shin MK,kvor跎JM,Illgram Rs,Tilghm肌sM.11Ie tempo甜 弛quiment fh endotIleIin receptorB si印aUing during nellraI cmt d叭帆mJ.Natum,1999,402:496501. Albin S甑delin,Wyeth W.W晒硼肌明d B丽s knhard.C蚰一 site:webba鲥d prediction 0f哪latoly eIements using cm鲻一 8pecies c哪p耐鲫nJ.NucIeic Acid8R.,2004,32(Web semr i8sue:W249一W252.呲ai D,J佣PA.C伽pfiehensive蛐alysis 0fCpG

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论