基于计算生物学的环形RNA二级结构与功能解析_第1页
基于计算生物学的环形RNA二级结构与功能解析_第2页
基于计算生物学的环形RNA二级结构与功能解析_第3页
基于计算生物学的环形RNA二级结构与功能解析_第4页
基于计算生物学的环形RNA二级结构与功能解析_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于计算生物学的环形RNA二级结构与功能解析一、引言1.1研究背景RNA作为生物体内重要的核酸分子,长期以来备受关注。传统认知中,RNA主要以线性形式存在,承担着遗传信息传递和蛋白质合成的关键任务。随着科学研究的持续深入,尤其是测序技术与生物信息学的飞速发展,一类特殊的RNA分子——环形RNA(circRNA)逐渐进入人们的视野,引发了科学界的广泛关注。环形RNA的发现可以追溯到20世纪70年代。1976年,Sanger等人在研究马铃薯纺锤体块茎病类病毒时,首次发现了环状RNA分子,当时将其描述为“单链和共价的闭合的RNA分子”。然而,由于技术手段的限制,对circRNA的研究进展缓慢。直到1979年,Hsu和Coca-Prados使用电子显微镜在HeLa细胞中观察到无自由侧翼末端的circRNA分子,才首次证实真核细胞中存在circRNA。但在之后很长一段时间里,circRNA被认为是转录过程中的错误产物,未受到足够重视。21世纪初,随着高通量测序技术和生物信息学的兴起,circRNA的研究迎来了重大突破。2012年,斯坦福大学和霍华德休斯医学研究所的科学家们发表在《PlosOne》的研究首次证实在人体细胞的基因表达程序中,环形RNA分子是一个普遍特征。2013年,Nature杂志同期发表两篇circRNA研究文章,揭示了circRNA的广泛存在和潜在功能,自此circRNA相关研究呈爆发式增长,逐渐成为非编码RNA领域的研究热点。环形RNA具有独特的结构特点,其呈闭合环状结构,没有5'末端帽子和3'末端poly(A)尾巴,这种结构使其不易被核酸外切酶降解,比线性RNA更加稳定。circRNA由特殊可变剪切产生,大量存在于真核细胞的细胞质中,主要来源于外显子,少部分内含子来源的circRNA存在于细胞核中。circRNA的表达水平具有种属、组织、时间特异性,且具有一定序列保守性。根据其来源和形成机制,circRNA可分为多种类型,主要包括外显子circRNA(ecircRNA)、内含子circRNA(ciRNA)以及外显子-内含子circRNA(EIciRNA)。外显子circRNA仅含外显子,占总circRNA的80%以上,通过套索驱动的环化或直接反向剪接环化产生;内含子circRNA由从套索衍生机制的分枝中逃脱的内含子产生;外显子-内含子circRNA由外显子跳跃环化产生,其功能相对复杂,可能同时涉及转录和转录后两个层面的调控。大量研究表明,circRNA在生物体内发挥着广泛而重要的生物学功能。在基因表达调控方面,circRNA可与宿主DNA结合形成R-loop,影响DNA复制、转录和损伤后修复;还能作为“海绵”吸附microRNA(miRNA)或蛋白,间接调控基因表达。例如,circHIPK3可与miR-124结合并抑制其活性,从而调控相关基因的表达。在细胞生理活动中,circRNA也扮演着重要角色,如EBV感染宿主后产生的circBART2.2,可被细胞RIG-I受体识别,激活下游干扰素信号通路,实现抗病毒作用。此外,部分circRNA还具有编码蛋白质的功能,拓展了其生物学功能的多样性。circRNA的异常表达与多种疾病的发生发展密切相关。在癌症领域,circRNA在肿瘤的发生、发展、转移和耐药等过程中发挥着关键作用,可作为潜在的癌症诊断标志物和治疗靶点。如在白血病中,circRNA在混合谱系白血病(MLL)重组基因组中富集,通过形成circR-loop促进致癌染色体易位,最终导致白血病的发生。在神经系统疾病中,circRNA的表达变化也与神经退行性疾病、精神疾病等的发病机制相关。对circRNA与疾病关系的深入研究,为疾病的诊断、治疗和预后评估提供了新的思路和方法。尽管目前对circRNA的研究取得了一定进展,但仍有许多问题亟待解决。例如,circRNA的二级结构特征及其与功能的关系尚不明确,circRNA在生物体内的作用机制和调控网络还需进一步深入探究。因此,本研究旨在运用计算生物学方法,深入剖析环形RNA的二级结构特征及生物学功能,为揭示circRNA的奥秘提供新的见解和理论依据。1.2研究目的与意义本研究旨在通过计算生物学方法,深入剖析环形RNA的二级结构特征,探索其与生物学功能之间的关联,为揭示circRNA的作用机制提供理论依据,具体研究目的如下:解析环形RNA二级结构特征:运用生物信息学工具和算法,对已有的circRNA序列数据进行分析,预测其二级结构,包括茎环结构、发夹结构等,明确不同类型circRNA二级结构的特点和分布规律。探究二级结构与生物学功能的关系:结合circRNA的功能注释信息,分析其二级结构与生物学功能(如基因表达调控、miRNA海绵作用、蛋白质结合等)之间的内在联系,揭示二级结构在circRNA功能发挥中的作用机制。构建环形RNA二级结构与功能数据库:整合circRNA的序列、二级结构、功能等信息,构建综合性数据库,为后续研究提供数据支持和资源共享平台,方便科研人员查询和分析。circRNA作为一类具有独特结构和重要功能的非编码RNA,对其二级结构特征及生物学功能的研究具有重要的科学意义和潜在的应用价值,具体体现在以下几个方面:理论意义:深化对RNA结构与功能多样性的认识:传统上,对RNA的研究主要集中在线性RNA上,对circRNA的研究相对较少。深入研究circRNA的二级结构特征及生物学功能,有助于揭示RNA分子的结构与功能多样性,丰富我们对RNA世界的认识,完善RNA生物学理论体系。拓展对基因表达调控网络的理解:circRNA在基因表达调控中发挥着重要作用,通过与miRNA、蛋白质等相互作用,参与转录和转录后调控过程。研究circRNA的二级结构与功能关系,能够进一步阐明其在基因表达调控网络中的作用机制,揭示基因表达调控的复杂性和精细性,为理解生命过程的调控机制提供新的视角。实际应用价值:疾病诊断与治疗:circRNA的异常表达与多种疾病的发生发展密切相关,可作为潜在的疾病诊断标志物和治疗靶点。了解circRNA的二级结构特征及生物学功能,有助于筛选和鉴定与疾病相关的circRNA,开发基于circRNA的诊断方法和治疗策略,为疾病的早期诊断、精准治疗和预后评估提供新的手段和方法,具有重要的临床应用价值。药物研发:circRNA的独特结构和功能使其成为药物研发的新靶点和新工具。基于circRNA的二级结构特征,可以设计和开发新型的RNA药物,如RNA干扰药物、RNA适配体等,用于治疗各种疾病。此外,circRNA还可以作为药物载体,提高药物的稳定性和靶向性,为药物研发提供新的思路和方法。生物技术应用:在生物技术领域,circRNA的研究成果也具有广泛的应用前景。例如,利用circRNA的稳定性和特殊结构,可以开发新型的生物传感器、生物芯片等,用于生物分子的检测和分析;在基因工程中,circRNA可以作为基因表达调控元件,实现对基因表达的精准调控,提高基因工程的效率和安全性。1.3国内外研究现状近年来,环形RNA凭借其独特的结构和重要的生物学功能,在国内外掀起了研究热潮,相关研究成果不断涌现。在国外,科研人员对circRNA的研究起步较早,在基础研究和应用探索方面都取得了丰硕的成果。在结构解析方面,运用先进的实验技术和计算方法,深入剖析circRNA的二级结构特征。如通过化学修饰和高通量测序相结合的方法,绘制circRNA的二级结构图谱,揭示其茎环、假结等结构元件的分布规律。在功能机制研究上,大量研究表明circRNA在基因表达调控中发挥关键作用。例如,德国的研究团队发现circRNA可通过与转录因子相互作用,影响基因的转录起始和延伸过程;美国的科学家则证实circRNA能够作为miRNA海绵,吸附miRNA,解除其对靶基因的抑制作用,从而调控基因表达。在疾病关联研究方面,国外研究人员发现circRNA的异常表达与多种疾病密切相关。如在癌症研究中,发现某些circRNA在肿瘤组织中高表达,可促进肿瘤细胞的增殖、迁移和侵袭;在神经系统疾病研究中,揭示了circRNA在神经退行性疾病发病机制中的作用,为疾病的诊断和治疗提供了新的靶点。国内的科研团队也在circRNA研究领域积极探索,取得了一系列具有国际影响力的成果。在分子特征研究方面,通过大规模测序和生物信息学分析,系统鉴定了多种物种和组织中的circRNA,深入分析其序列特征、表达模式和进化保守性。例如,浙江大学樊龙江教授团队通过分析已发表的植物circRNA数据,揭示了circRNA的来源、可变剪接现象、剪接信号特征以及潜在的miRNA-circRNA网络等。在功能验证方面,国内学者运用基因编辑等技术,对circRNA的生物学功能进行了深入验证。中山大学孙逸仙纪念医院苏士成团队确定了一种线粒体特异性circRNA——SCAR,在非酒精性脂肪性肝炎(NASH)中表达下调,向线粒体特异性递送SCAR,可降低线粒体活性氧(mROS)输出,减轻炎症,为NASH的治疗提供了新的靶点。在应用研究方面,国内科研人员积极探索circRNA在疾病诊断、治疗和药物研发等方面的应用潜力。如开发基于circRNA的生物标志物,用于疾病的早期诊断和预后评估;开展circRNA药物的研发,探索其在癌症、神经系统疾病等治疗中的应用前景。尽管目前对circRNA的研究取得了显著进展,但仍存在一些不足之处。在二级结构预测方面,现有的计算方法准确性和可靠性有待提高,不同算法预测结果存在差异,缺乏统一的标准和验证方法。在功能机制研究方面,虽然已知circRNA参与多种生物学过程,但对于其具体的作用机制和调控网络仍不完全清楚,尤其是circRNA与蛋白质、DNA等生物大分子之间的相互作用机制,还需要进一步深入研究。在疾病应用研究方面,虽然发现了许多与疾病相关的circRNA,但将其转化为临床应用的生物标志物或治疗靶点还面临诸多挑战,如circRNA的稳定性、递送效率以及安全性等问题,需要进一步探索有效的解决方案。针对现有研究的不足,本研究拟运用计算生物学方法,整合多组学数据,建立更准确的circRNA二级结构预测模型,深入探究其二级结构与生物学功能的关系;结合实验验证,揭示circRNA在基因表达调控和疾病发生发展中的作用机制,为circRNA的研究和应用提供新的理论依据和技术支持。二、环形RNA概述2.1环形RNA的发现与发展环形RNA的研究历程充满了曲折与突破,其从最初被偶然发现,到逐渐被科学界所认知,每一个阶段都伴随着技术的进步与科研人员的不懈探索。1976年,Sanger等人在研究马铃薯纺锤体块茎病类病毒时,首次发现了环状RNA分子,当时将其描述为“单链和共价的闭合的RNA分子”。这一发现为RNA领域开启了新的大门,然而,由于当时技术手段的限制,对circRNA的研究难以深入开展,其在很长一段时间内处于研究的边缘地带。1979年,Hsu和Coca-Prados使用电子显微镜在HeLa细胞中观察到无自由侧翼末端的circRNA分子,首次证实真核细胞中存在circRNA。但在后续的研究中,circRNA一直被视为转录过程中的错误产物,未受到足够的重视。21世纪初,随着高通量测序技术和生物信息学的兴起,circRNA的研究迎来了重大转机。2012年,斯坦福大学和霍华德休斯医学研究所的科学家们发表在《PlosOne》的研究首次证实在人体细胞的基因表达程序中,环形RNA分子是一个普遍特征。这一研究成果打破了人们对RNA的传统认知,使得circRNA开始进入科学家们的视野中心。2013年,Nature杂志同期发表两篇circRNA研究文章,进一步揭示了circRNA的广泛存在和潜在功能,自此circRNA相关研究呈爆发式增长,逐渐成为非编码RNA领域的研究热点。随着研究的深入,科研人员对circRNA的结构、功能和作用机制有了更深入的认识。在结构方面,通过化学修饰和高通量测序相结合的方法,绘制circRNA的二级结构图谱,揭示其茎环、假结等结构元件的分布规律。在功能机制研究上,大量研究表明circRNA在基因表达调控中发挥关键作用。例如,circRNA可通过与转录因子相互作用,影响基因的转录起始和延伸过程;还能够作为miRNA海绵,吸附miRNA,解除其对靶基因的抑制作用,从而调控基因表达。在疾病关联研究方面,发现circRNA的异常表达与多种疾病密切相关,为疾病的诊断和治疗提供了新的靶点。回顾环形RNA的发现与发展历程,从最初的偶然发现到如今成为科研热点,每一个阶段都离不开技术的创新和科研人员的努力。未来,随着研究的不断深入,相信circRNA将在生命科学和医学领域展现出更加广阔的应用前景。2.2环形RNA的结构特点2.2.1一级结构环形RNA的一级结构即为其核苷酸序列,由腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和尿嘧啶(U)四种核苷酸通过3',5'-磷酸二酯键连接而成。circRNA的序列长度差异较大,短则几十到几百个核苷酸,长则可达数千个核苷酸。其序列来源广泛,主要来源于基因的外显子区域,也有部分来源于内含子、基因间区或非转录区。外显子来源的circRNA保留了原始基因的编码信息,部分circRNA甚至可通过非帽依赖的翻译机制编码蛋白质。例如,2017年王泽峰团队首次发现大量的circRNA富含m6A修饰,可以像IRES一样驱动circRNA翻译,拓展了circRNA在蛋白质编码领域的研究。circRNA的序列特征还表现出一定的保守性,不同物种间部分circRNA的序列具有相似性。有研究发现小鼠和人类中的直系同源基因,依然有5-30%相似的保守环状RNA。这种保守性暗示了circRNA在进化过程中可能具有重要的生物学功能,对维持生物的基本生命活动或适应环境变化起到关键作用。此外,circRNA的表达具有组织特异性和发育阶段特异性。在不同的组织和细胞类型中,circRNA的表达谱存在显著差异。例如,在心脏、肝脏、大脑等组织中,circRNA的表达水平和种类各不相同。在个体发育过程中,circRNA的表达也会发生动态变化,从胚胎发育到成年阶段,circRNA的表达谱会随着细胞的分化和功能特化而改变。这种特异性表达表明circRNA在不同组织和发育阶段可能参与了特定的生物学过程,对细胞的功能维持和分化调控发挥着重要作用。2.2.2独特的二级结构环形RNA独特的二级结构使其区别于其他RNA,在生命活动中发挥着特殊作用。circRNA主要通过反向剪接形成闭合环状结构,这种结构赋予其较高的稳定性,使其不易被核酸外切酶降解。circRNA的二级结构中,茎环结构是常见的特征之一。茎环结构由一段双链RNA区域(茎)和一段单链RNA环组成,通过碱基互补配对形成。研究表明,circRNA中的茎环结构在其功能发挥中起着重要作用,例如作为miRNA或蛋白质的结合位点,参与基因表达调控。如circHIPK3含有多个miRNA结合位点,通过茎环结构与miR-124等miRNA结合,充当miRNA海绵,解除miRNA对靶基因的抑制作用,从而调控基因表达。除了茎环结构,circRNA还可能形成假结结构。假结结构是一种更为复杂的二级结构,由RNA链自身折叠形成多个茎环结构相互嵌套而成。假结结构的形成增加了circRNA二级结构的复杂性和稳定性,同时也为其与其他生物分子的相互作用提供了更多的可能性。假结结构可能影响circRNA的翻译起始、与蛋白质的结合能力等,进而调控其生物学功能。虽然目前对circRNA假结结构的研究相对较少,但随着研究的深入,假结结构在circRNA功能中的重要性将逐渐被揭示。此外,circRNA的二级结构还受到多种因素的影响,如核苷酸序列、离子浓度、温度等。不同的circRNA由于其核苷酸序列的差异,会形成不同的二级结构;离子浓度和温度的变化也会影响RNA分子内碱基之间的相互作用,从而改变circRNA的二级结构。深入研究这些影响因素,有助于更好地理解circRNA二级结构的形成机制及其与功能的关系。2.3环形RNA的分类与生成机制2.3.1分类根据其来源和形成机制,环形RNA可分为多种类型,主要包括外显子环形RNA(ecircRNA)、内含子环形RNA(ciRNA)以及外显子-内含子环形RNA(EIciRNA)。外显子环形RNA仅由外显子序列环化形成,是最为常见的一类circRNA,占总circRNA的80%以上。其形成过程主要通过套索驱动的环化或直接反向剪接环化。在套索驱动的环化过程中,外显子跳过一个功能性的转录本,并形成一个由跳过外显子和内含子组成的套索中间物,这个套索可以进行二次裂解以释放外显子,进而形成ecircRNA。直接反向剪接环化则是下游的3'剪接位点与上游的5'剪接位点直接相连,形成共价连接的闭环。外显子环形RNA保留了原始基因的编码信息,部分ecircRNA甚至可通过非帽依赖的翻译机制编码蛋白质。内含子环形RNA由内含子序列环化产生,其形成机制与外显子环形RNA有所不同。内含子环形RNA主要由从套索衍生机制的分枝中逃脱的内含子产生,这些内含子在环化过程中通常需要特定的顺式作用元件和反式作用因子的参与。ciRNA主要存在于细胞核中,在转录后调控过程中发挥重要作用,如通过与RNA聚合酶II相互作用,影响基因的转录效率。外显子-内含子环形RNA由外显子和内含子序列共同环化形成,其功能相对复杂,可能同时涉及转录和转录后两个层面的调控。EIciRNA的形成通常需要外显子跳跃环化,即部分外显子跳过正常的剪接位点,与上下游的内含子或外显子进行反向剪接,形成包含外显子和内含子的环形结构。在转录调控方面,EIciRNA可与U1snRNP结合形成复合物,通过与启动子区域的相互作用,促进基因的转录;在转录后调控中,EIciRNA可能通过与miRNA或蛋白质相互作用,影响mRNA的稳定性和翻译效率。此外,还有一些特殊类型的环形RNA,如基因间环形RNA,由基因间区域的序列环化形成,其功能和形成机制尚不完全清楚,有待进一步深入研究。不同类型的环形RNA在细胞中发挥着各自独特的作用,共同构成了circRNA复杂而多样的生物学功能网络。2.3.2生成机制环形RNA的生成主要通过反向剪接机制,这一过程涉及多个顺式作用元件和反式作用因子的参与,与传统的线性RNA剪接过程既相互关联又有所区别。反向剪接是环形RNA形成的核心步骤,其过程中,下游的3'剪接位点与上游的5'剪接位点发生异常连接,从而使外显子或内含子形成闭合的环状结构。与传统的线性RNA剪接中上下游相邻外显子依次连接不同,反向剪接打破了常规的剪接顺序,使得RNA链发生反向连接。Jeck在2013年提出了两种RNA的回接形成模型:套索驱动的环化模型和内含子配对驱动模型。在套索驱动的环化模型中,当5‘剪接点和分支点附近富集GU的7nt碱基序列和富含C的11nt碱基的序列时,可以诱导内含子形成长链结构避免被分支酶降解,外显子跳过一个功能性的转录本,并形成一个由跳过外显子和内含子组成的套索中间物,这个套索可以进行二次裂解以释放外显子,进而形成环形RNA。在内含子配对驱动的环化模型中,长侧内含子中的直接碱基配对,如ALU重复元素,可以在前mRNA中形成二级结构,这对下游剪接供体的后续连接至关重要。顺式作用元件在环形RNA的生成中起着重要的调控作用。内含子中的反向互补序列是常见的顺式作用元件之一,如人类和小鼠基因组中广泛存在的ALU重复序列。这些反向互补序列可以通过碱基配对形成双链结构,拉近上下游剪接位点的空间距离,促进反向剪接的发生。外显子两侧的特定序列也可能影响环形RNA的生成,某些外显子具有较高的环化倾向,其两侧的序列特征可能为反向剪接提供了有利条件。反式作用因子同样参与了环形RNA生成的调控过程。RNA结合蛋白(RBPs)是一类重要的反式作用因子,它们可以识别并结合在前mRNA上,对下游剪接供体和上游剪接接受体之间的连接发挥关键作用。例如,Quaking(QKI)蛋白可以结合在特定的RNA序列上,促进环形RNA的形成;肌肉失明蛋白(MBNL)则通过与侧翼内含子结合,影响环形RNA的反向剪接。一些转录因子也可能通过调节基因转录的速率和剪接体的组装,间接影响环形RNA的生成。环形RNA的生成与线性RNA剪接之间存在着复杂的竞争关系。在同一基因座上,既可以产生线性RNA,也可以产生环形RNA,二者的比例受到多种因素的调控。顺式作用元件和反式作用因子的相对丰度和活性变化,会影响剪接方式的选择,从而决定线性RNA和环形RNA的生成比例。细胞的生理状态、发育阶段以及外界环境刺激等因素,也可能通过调节相关基因的表达和剪接因子的活性,影响环形RNA和线性RNA的生成平衡。三、计算生物学在环形RNA研究中的应用3.1计算生物学方法简介计算生物学作为一门交叉学科,融合了数学、统计学、计算机科学等多学科的理论与方法,旨在解决生物学领域的各种复杂问题。在环形RNA研究中,计算生物学方法发挥着至关重要的作用,为深入探索circRNA的结构与功能提供了有力的工具和手段。生物信息学分析是计算生物学的核心组成部分之一,在circRNA研究中应用广泛。通过对高通量测序数据的分析,可以大规模地识别和鉴定circRNA。利用序列比对算法,将测序得到的短读段(reads)与参考基因组进行比对,寻找反向剪接位点,从而确定circRNA的存在及其边界。常用的比对工具如STAR、HISAT2等,能够高效地处理大规模的测序数据,准确识别circRNA。通过生物信息学分析,还可以对circRNA的序列特征进行深入挖掘,包括核苷酸组成、保守性分析、开放阅读框(ORF)预测等。核苷酸组成分析可以揭示circRNA序列中不同碱基的分布规律,为后续的结构和功能研究提供基础;保守性分析则有助于发现具有重要生物学功能的circRNA,因为保守性较高的circRNA往往在进化过程中承担着关键作用。对circRNA中ORF的预测,可以初步判断其是否具有编码蛋白质的潜力,拓展了对circRNA功能的认识。机器学习作为人工智能领域的重要分支,在计算生物学中也展现出强大的优势,为circRNA研究带来了新的思路和方法。机器学习算法可以从大量的生物数据中自动学习模式和规律,用于预测circRNA的结构和功能。在circRNA二级结构预测方面,深度学习算法取得了显著进展。例如,基于卷积神经网络(CNN)和循环神经网络(RNN)的模型,能够有效地学习RNA序列中的特征,准确预测circRNA的二级结构。这些模型通过对大量已知结构的RNA序列进行训练,学习到序列与结构之间的复杂关系,从而对未知结构的circRNA进行准确预测。机器学习还可以用于circRNA的功能预测。通过构建机器学习模型,整合circRNA的序列特征、表达模式、与其他生物分子的相互作用信息等多维度数据,预测circRNA在基因表达调控、细胞生理过程等方面的功能。支持向量机(SVM)、随机森林等算法在circRNA功能预测中得到了广泛应用,为揭示circRNA的生物学功能提供了有力的支持。除了生物信息学分析和机器学习,其他计算生物学方法也在circRNA研究中发挥着重要作用。分子动力学模拟可以从原子层面研究circRNA的结构动态变化,揭示其与其他生物分子相互作用的机制。通过模拟circRNA在不同环境条件下的结构变化,以及与蛋白质、DNA等分子的结合过程,可以深入了解circRNA的功能实现方式。网络分析方法则可以用于构建circRNA与其他生物分子之间的相互作用网络,如circRNA-miRNA-mRNA调控网络、circRNA-蛋白质相互作用网络等。通过对这些网络的拓扑结构分析、功能模块挖掘等,可以揭示circRNA在复杂生物调控网络中的作用和地位。三、计算生物学在环形RNA研究中的应用3.2环形RNA数据获取与处理3.2.1数据来源本研究主要通过高通量测序技术获取环形RNA数据。高通量测序技术,也被称为下一代测序技术(NGS),能够在短时间内对大量的核酸分子进行测序,具有高通量、低成本、高准确性等优势,为大规模研究环形RNA提供了可能。在实验过程中,选取多种组织样本,包括人体的心脏、肝脏、大脑等重要器官组织,以及不同发育阶段的胚胎组织等,以确保获取的环形RNA数据具有广泛的代表性。对这些组织样本进行RNA提取,采用高质量的RNA提取试剂盒,严格按照操作步骤进行,以保证提取的RNA纯度和完整性。提取得到的总RNA需要进行质量检测,使用NanoDrop分光光度计测定RNA的浓度和纯度,确保A260/A280比值在1.8-2.0之间;通过琼脂糖凝胶电泳检测RNA的完整性,观察28S和18SrRNA条带的亮度和清晰度,以判断RNA是否降解。为了富集环形RNA,采用去除核糖体RNA(rRNA)和Poly-A尾RNA的方法。利用RiboMinus™Human/MouseTranscriptomeIsolationKit等试剂盒去除rRNA,再通过磁珠法结合Poly(A)的RNA后,剩余的RNA即为Poly(A)-RNA样品,其中环形RNA得到了有效富集。对富集后的RNA样品进行RNaseR消化处理,RNaseR是一种能够降解线性RNA的核酸外切酶,但对环形RNA具有抗性。将RNA样品一分为二,一份进行RNaseR消化,另一份作为对照,消化条件为加入3μL10×RNaseRReactionBuffer和1μLRNaseR(20U/μl),在37°C孵育1-2h。消化结束后,加入酚-氯仿-异戊醇终止反应,通过离心分层,弃去上清,沉淀用4M氯化锂、糖原和预冷无水乙醇进行重悬,在−80°C沉淀1h,然后离心,用75%预冷乙醇洗涤两次,风干后用DEPC水溶解,得到的RNA样品中环形RNA的比例进一步提高。将处理后的RNA样品用于RNA-seq文库构建,使用Illumina等公司的文库构建试剂盒,按照标准流程进行操作,包括RNA片段化、反转录、接头连接、PCR扩增等步骤。构建好的文库经过质量检测,使用Agilent2100Bioanalyzer测定文库的片段大小分布,利用qPCR测定文库的浓度,确保文库质量符合测序要求。将合格的文库在IlluminaHiSeq、NovaSeq等高通量测序平台上进行测序,获得大量的测序读段(reads),这些reads是后续分析环形RNA的基础数据。除了自行测序获得的数据外,还从公共数据库中获取相关的环形RNA数据,以扩充数据集。常用的公共数据库如circBase,收录了包括人类、小鼠、黑腹果蝇、秀丽隐杆线虫等多个物种的环状RNA数据,为研究提供了丰富的资源。从circBase数据库中,可以获取环形RNA的序列信息、基因组坐标、表达谱等数据,通过与自行测序数据进行整合分析,能够更全面地研究环形RNA的特征和功能。3.2.2数据预处理对高通量测序得到的原始数据进行预处理是数据分析的关键步骤,旨在去除低质量数据和噪声,提高数据的质量和可用性,为后续的分析提供可靠的基础。首先进行测序读段的质量控制。使用FastQC等工具对原始测序数据进行质量评估,FastQC能够生成详细的质量报告,展示每个读段的碱基质量分布、GC含量、序列重复率等信息。通过分析质量报告,确定低质量区域和可能存在的污染序列。对于碱基质量较低的区域,采用Trimmomatic等软件进行修剪,设定质量阈值,如Q值低于20的碱基将被切除;对于接头序列污染,使用软件自动识别并去除接头序列。通过质量控制,去除低质量的读段和碱基,提高数据的整体质量。在数据过滤阶段,去除可能的污染数据。由于实验过程中可能引入外源DNA或RNA污染,需要对数据进行严格过滤。将测序读段与常见的污染序列数据库进行比对,如PhiX噬菌体基因组序列、人类线粒体基因组序列等,去除与污染序列匹配的读段。通过比对统计,评估污染程度,确保数据的纯净性。数据去重也是预处理的重要环节。测序过程中可能会产生大量重复的读段,这些重复读段可能是由于PCR扩增偏好性或测序误差导致的,会影响后续分析结果的准确性。使用Picard工具中的MarkDuplicates模块进行数据去重,该模块通过识别具有相同起始位置和序列的读段,将其标记为重复读段并去除,保留唯一的读段,从而减少数据量,提高分析效率。经过质量控制、过滤和去重等预处理步骤后,得到的高质量测序数据为环形RNA的鉴定和分析奠定了坚实的基础。这些经过预处理的数据将用于后续的生物信息学分析,如环形RNA的识别、结构预测和功能注释等,确保分析结果的可靠性和准确性。3.3计算方法在环形RNA二级结构预测中的应用3.3.1常用预测算法动态规划算法是预测环形RNA二级结构的经典方法之一,其中最具代表性的是Zuker算法。该算法基于最小自由能原理,假设RNA分子会折叠成自由能最低的二级结构。在计算过程中,将RNA序列划分为多个子序列,通过递归计算每个子序列的最小自由能,逐步构建出整个RNA分子的二级结构。对于一个长度为n的RNA序列,Zuker算法通过定义一个二维数组M[i][j]来表示从第i个核苷酸到第j个核苷酸的子序列的最小自由能。在计算M[i][j]时,考虑所有可能的碱基配对情况,包括茎环结构、内部环、多分支环等,并根据已知的热力学参数计算每种配对方式的自由能变化。通过比较不同配对方式的自由能,选择自由能最小的配对方式,从而确定M[i][j]的值。最终,通过回溯算法,从M[1][n]的值反向推导出整个RNA分子的二级结构。Zuker算法在预测不包含假结的RNA二级结构时具有较高的准确性和效率,被广泛应用于各种RNA二级结构预测软件中,如Mfold、RNAfold等。随着机器学习技术的发展,基于机器学习的算法在环形RNA二级结构预测中展现出独特的优势。这些算法通过对大量已知二级结构的RNA序列进行学习,建立起序列特征与二级结构之间的关系模型,从而对未知结构的环形RNA进行预测。支持向量机(SVM)是一种常用的机器学习算法,在RNA二级结构预测中,SVM通过将RNA序列转化为特征向量,利用核函数将低维特征空间映射到高维空间,寻找一个最优的分类超平面,将形成碱基对的核苷酸对与未形成碱基对的核苷酸对区分开来。为了将RNA序列转化为适合SVM输入的特征向量,需要提取多种序列特征,如核苷酸组成、碱基对概率、二级结构元件的分布等。通过对这些特征的组合和优化,提高SVM模型的预测性能。深度学习算法在RNA二级结构预测中也取得了显著进展。基于卷积神经网络(CNN)和循环神经网络(RNN)的模型能够自动学习RNA序列中的复杂特征,捕捉核苷酸之间的长程相互作用,从而更准确地预测环形RNA的二级结构。以基于CNN的模型为例,其通过卷积层对RNA序列进行特征提取,卷积核在序列上滑动,提取不同位置的局部特征;池化层则用于对特征进行降维,减少计算量并保留关键特征;全连接层将提取到的特征进行整合,输出预测的二级结构。在训练过程中,通过大量的已知结构的RNA序列数据对模型进行训练,不断调整模型的参数,使其能够准确地学习到序列与结构之间的关系。除了上述算法外,还有一些其他方法也被应用于环形RNA二级结构预测。随机上下文无关语法(SCFG)算法将RNA二级结构的形成过程看作是一个概率生成过程,通过构建语法规则和概率模型,对RNA二级结构进行预测。SCFG算法考虑了RNA二级结构中不同结构元件的出现概率和相互关系,能够对包含假结等复杂结构的RNA进行预测。但该算法计算复杂度较高,在处理长序列时存在一定的局限性。一些混合算法将不同的预测方法相结合,取长补短,以提高预测的准确性和可靠性。例如,将热力学模型与机器学习算法相结合,利用热力学模型提供的先验知识,辅助机器学习模型进行预测,从而减少模型的过拟合风险,提高预测性能。3.3.2预测准确性评估预测环形RNA二级结构的准确性评估是衡量预测算法性能的关键环节,对于判断预测结果的可靠性、比较不同算法的优劣以及改进预测方法具有重要意义。目前,常用的评估指标和方法主要包括以下几个方面。敏感度(Sensitivity,Sn)和特异性(Specificity,Sp)是评估预测准确性的重要指标。敏感度表示预测正确的碱基对在真实碱基对中所占的比例,反映了预测算法对真实结构中碱基对的识别能力。其计算公式为:Sn=TP/(TP+FN),其中TP(TruePositive)表示预测正确的碱基对数量,FN(FalseNegative)表示实际存在但未被预测到的碱基对数量。特异性则表示预测正确的非碱基对在真实非碱基对中所占的比例,衡量了预测算法对非碱基对的正确判断能力。其计算公式为:Sp=TN/(TN+FP),其中TN(TrueNegative)表示预测正确的非碱基对数量,FP(FalsePositive)表示实际不存在但被错误预测为碱基对的数量。一般来说,敏感度和特异性越高,说明预测算法的性能越好。理想情况下,Sn和Sp都应接近1,但在实际预测中,这两个指标往往需要在一定程度上进行平衡。马修斯相关系数(MatthewsCorrelationCoefficient,MCC)综合考虑了预测结果中的真阳性、真阴性、假阳性和假阴性,能够更全面地评估预测算法的性能。MCC的取值范围为[-1,1],值越接近1,表示预测结果与真实结果的一致性越好;值为0时,表示预测结果与随机猜测相当;值为-1时,表示预测结果与真实结果完全相反。其计算公式为:MCC=(TP×TN-FP×FN)/√[(TP+FP)(TP+FN)(TN+FP)(TN+FN)]。MCC在评估预测准确性方面具有较高的可靠性,尤其适用于样本不均衡的情况。在环形RNA二级结构预测中,由于碱基对和非碱基对的数量可能存在较大差异,MCC能够更准确地反映预测算法的性能。除了上述指标外,还可以通过与已知的实验结构进行比较来评估预测准确性。将预测得到的环形RNA二级结构与通过实验手段(如X射线晶体学、核磁共振等)测定的真实结构进行比对,计算两者之间的相似度。常用的相似度指标包括均方根偏差(RootMeanSquareDeviation,RMSD)、结构相似性指数(StructuralSimilarityIndex,SSI)等。RMSD用于衡量预测结构与真实结构中对应原子位置的偏差程度,RMSD值越小,表示预测结构与真实结构越接近。SSI则从整体结构的角度评估两个结构的相似性,考虑了结构的拓扑特征和碱基对的分布情况。通过与实验结构的比较,可以直观地了解预测算法的准确性,发现预测结果中存在的问题,为改进算法提供依据。但需要注意的是,实验测定的RNA结构也可能存在一定的误差和不确定性,在评估时需要综合考虑这些因素。四、环形RNA的二级结构特征分析4.1茎环结构分析4.1.1茎环结构的形成与特点茎环结构是环形RNA二级结构的重要组成部分,对其功能的发挥起着关键作用。茎环结构的形成是RNA分子折叠过程中的一个重要事件,涉及到核苷酸序列的相互作用和热力学因素。在环形RNA中,茎环结构的形成主要依赖于碱基互补配对原则。当RNA序列中存在反向互补的区域时,这些区域会通过碱基配对形成双链结构,即茎部;而在双链结构的两端,未配对的核苷酸则形成单链的环状结构,即环部。这种茎环结构的形成使得RNA分子能够折叠成特定的三维构象,增加了分子的稳定性。茎环结构的特点使其在环形RNA中具有独特的生物学功能。茎部的双链结构具有较高的稳定性,能够抵抗核酸酶的降解作用,从而保护RNA分子的完整性。环部的单链结构则具有较高的灵活性,能够与其他生物分子发生相互作用,如与蛋白质、miRNA等结合,参与基因表达调控等生物学过程。茎环结构的大小和序列组成也会影响其功能。较小的茎环结构可能更容易与其他分子结合,而较大的茎环结构则可能具有更强的稳定性。不同的核苷酸序列组成会导致茎环结构的热力学稳定性和结构柔性不同,进而影响其与其他分子的相互作用能力。茎环结构在环形RNA中的分布具有一定的规律性。研究发现,茎环结构在不同类型的环形RNA中分布存在差异,且在同一环形RNA分子中,茎环结构的位置和数量也会影响其功能。在一些外显子来源的环形RNA中,茎环结构可能主要分布在编码区域附近,对基因的翻译过程产生影响;而在内含子来源的环形RNA中,茎环结构则可能与转录调控元件相互作用,参与基因的转录调控。4.1.2茎环结构对环形RNA稳定性的影响茎环结构对环形RNA的稳定性具有重要影响,是维持环形RNA结构完整性和功能正常发挥的关键因素之一。茎环结构通过增加分子内的相互作用,增强了环形RNA的稳定性。茎部的双链结构通过碱基互补配对形成氢键,使得RNA分子内部的相互作用增强,从而增加了分子的稳定性。这种双链结构能够抵抗核酸酶的降解作用,因为核酸酶通常需要识别和结合单链RNA区域才能发挥作用,而茎环结构中的双链茎部对核酸酶具有一定的抗性。环部的单链结构虽然相对不稳定,但它可以通过与茎部的相互作用,进一步稳定整个茎环结构。环部的核苷酸可以与茎部的核苷酸形成非经典的碱基配对或其他相互作用,如碱基堆积作用等,从而增强茎环结构的稳定性。茎环结构的稳定性还与RNA分子的折叠方式有关。RNA分子在折叠过程中,会形成一系列的茎环结构,这些茎环结构之间的相互作用会影响整个分子的稳定性。当多个茎环结构相互靠近并形成稳定的相互作用时,RNA分子的稳定性会显著提高。一些环形RNA分子中存在多个茎环结构,这些茎环结构通过相互缠绕或堆积,形成了复杂的三维结构,进一步增强了分子的稳定性。茎环结构对环形RNA稳定性的影响还体现在其与其他生物分子的相互作用上。茎环结构可以作为蛋白质或miRNA的结合位点,当这些生物分子与茎环结构结合时,会改变RNA分子的结构和稳定性。一些RNA结合蛋白可以与茎环结构特异性结合,保护RNA分子免受核酸酶的降解,同时还可能影响RNA分子的功能。miRNA也可以通过与茎环结构互补配对,结合到环形RNA分子上,从而调控环形RNA的稳定性和功能。茎环结构在环形RNA的代谢过程中也发挥着重要作用。在环形RNA的合成和降解过程中,茎环结构的稳定性会影响这些过程的速率和效率。如果茎环结构不稳定,环形RNA可能更容易被降解;反之,如果茎环结构稳定,环形RNA则可以在细胞中持续存在并发挥作用。4.2碱基配对模式4.2.1常见碱基配对方式在环形RNA中,常见的碱基配对方式遵循经典的Watson-Crick碱基配对原则,即腺嘌呤(A)与尿嘧啶(U)通过两个氢键配对,鸟嘌呤(G)与胞嘧啶(C)通过三个氢键配对。这种碱基配对方式是维持RNA二级结构稳定性的基础,通过碱基之间的互补配对,RNA分子能够折叠形成各种复杂的二级结构,如茎环结构、发夹结构等。在茎环结构中,茎部的双链区域就是由互补的碱基对通过氢键相互作用形成的。当RNA序列中存在反向互补的区域时,这些区域会按照A-U、G-C的配对方式形成双链结构,从而构成茎环结构的茎部。这种碱基配对方式不仅赋予了茎部结构稳定性,还使得茎环结构能够与其他生物分子发生特异性相互作用。在circRNA与miRNA的相互作用中,miRNA通过与circRNA上互补的碱基序列配对,结合到circRNA的茎环结构上,从而影响circRNA的功能。除了A-U和G-C配对,在某些情况下,还会出现非标准的碱基配对方式,如G-U配对。G-U配对虽然不如G-C和A-U配对稳定,但在RNA分子中也较为常见。G-U配对的存在增加了RNA二级结构的多样性和复杂性,使得RNA分子能够形成更灵活的结构,以适应不同的生物学功能需求。在一些RNA分子中,G-U配对可以参与形成特殊的结构元件,如假结结构中的部分碱基配对。在某些circRNA的二级结构预测中,也发现了G-U配对的存在,其可能对circRNA的结构和功能产生一定的影响。碱基配对方式还受到环境因素的影响,如离子浓度、温度等。在高离子浓度条件下,离子可以屏蔽RNA分子中磷酸基团的负电荷,减少静电排斥力,从而有利于碱基配对的发生,增强RNA二级结构的稳定性。温度的变化也会影响碱基配对的稳定性,高温会破坏碱基之间的氢键,导致RNA二级结构的解折叠;而低温则有利于维持碱基配对,稳定RNA的二级结构。4.2.2特殊碱基配对及其功能除了常见的碱基配对方式,环形RNA中还存在一些特殊的碱基配对,这些特殊碱基配对在circRNA的结构形成和功能发挥中起着独特而重要的作用。Hoogsteen碱基配对是一种特殊的碱基配对方式,与传统的Watson-Crick碱基配对不同。在Hoogsteen碱基配对中,腺嘌呤(A)与胸腺嘧啶(T)或尿嘧啶(U)形成的氢键模式发生了改变,A的N7原子与T或U的O4原子形成氢键,同时A的N6氨基与T或U的N3原子形成氢键。在鸟嘌呤(G)与胞嘧啶(C)的Hoogsteen配对中,G的N7原子与C的O2原子形成氢键,G的N1原子与C的N3原子形成氢键。这种特殊的碱基配对方式通常出现在RNA的三链或四链结构中,通过形成额外的氢键,增加了RNA结构的稳定性和复杂性。在一些circRNA中,Hoogsteen碱基配对可能参与形成高级结构,如四链体结构。circRNA中的四链体结构可以与蛋白质或其他RNA分子相互作用,调控基因表达、信号传导等生物学过程。研究表明,某些circRNA中的四链体结构可以作为蛋白质的结合位点,招募特定的蛋白质,影响其功能。摆动碱基配对也是一种特殊的碱基配对现象,主要发生在密码子与反密码子的相互作用中。在摆动配对中,tRNA反密码子的第一位碱基(5'端)与mRNA密码子的第三位碱基(3'端)之间的配对具有一定的灵活性,不严格遵循Watson-Crick碱基配对原则。例如,反密码子的第一位碱基为次黄嘌呤(I)时,它可以与密码子的第三位碱基A、U或C配对;反密码子的第一位碱基为U时,它可以与密码子的第三位碱基A或G配对;反密码子的第一位碱基为G时,它可以与密码子的第三位碱基U或C配对。摆动碱基配对在circRNA中可能影响其与蛋白质的相互作用以及翻译过程。如果circRNA具有编码蛋白质的能力,摆动碱基配对可能导致翻译过程中氨基酸的错配或正确识别,从而影响蛋白质的序列和功能。摆动碱基配对还可能影响circRNA与RNA结合蛋白的相互作用,因为RNA结合蛋白通常通过识别特定的碱基序列或结构来结合RNA,摆动碱基配对可能改变circRNA的局部结构,进而影响其与蛋白质的结合亲和力和特异性。4.3与蛋白质相互作用相关的结构特征4.3.1结合位点预测准确预测环形RNA与蛋白质的结合位点对于深入理解它们之间的相互作用机制至关重要。目前,计算生物学方法在结合位点预测中发挥着关键作用,主要包括基于序列特征和基于结构特征的预测方法。基于序列特征的预测方法通过分析环形RNA和蛋白质的序列信息,提取相关特征并构建预测模型。核苷酸组成是一个重要的序列特征,不同的核苷酸在结合位点附近的分布可能存在特异性。鸟嘌呤(G)和胞嘧啶(C)含量较高的区域可能更容易与某些蛋白质结合,因为它们可以形成更稳定的碱基对,为蛋白质的结合提供更好的结构基础。k-mer频率也是常用的特征之一,k-mer是指长度为k的核苷酸序列片段,通过统计不同k-mer在结合位点区域和非结合位点区域的出现频率,可以挖掘出与结合相关的序列模式。利用机器学习算法,如支持向量机(SVM)、随机森林等,将这些序列特征作为输入,对环形RNA与蛋白质的结合位点进行预测。以SVM为例,首先将环形RNA序列转化为特征向量,每个特征对应一个序列特征,如核苷酸组成、k-mer频率等。然后使用已知结合位点的环形RNA和蛋白质数据作为训练集,对SVM模型进行训练,调整模型参数,使其能够准确地区分结合位点和非结合位点。最后,将待预测的环形RNA序列的特征向量输入训练好的模型,得到结合位点的预测结果。随着对RNA结构研究的深入,基于结构特征的预测方法逐渐受到关注。RNA的二级结构,如茎环结构、发夹结构等,对其与蛋白质的相互作用具有重要影响。茎环结构中的环区通常具有较高的柔性,更容易与蛋白质发生相互作用,因此可以将茎环结构的位置和特征作为预测结合位点的重要依据。通过预测环形RNA的二级结构,结合蛋白质的三维结构信息,可以更准确地预测结合位点。利用分子对接技术,将环形RNA的二级结构模型与蛋白质的三维结构模型进行对接,通过计算两者之间的相互作用能量,寻找能量最低的结合模式,从而确定可能的结合位点。在分子对接过程中,考虑到RNA和蛋白质分子的柔性,可以采用柔性对接方法,允许分子在对接过程中发生一定程度的构象变化,以更真实地模拟它们的结合过程。一些基于深度学习的方法也被应用于结合位点预测,通过对大量的RNA-蛋白质复合物结构数据进行学习,模型可以自动提取结构特征,实现对结合位点的准确预测。4.3.2结构特征对相互作用的影响环形RNA的结构特征在其与蛋白质的相互作用中起着关键作用,不同的结构特征会对相互作用的亲和力、特异性和功能产生不同的影响。茎环结构作为环形RNA二级结构的重要组成部分,对与蛋白质的相互作用具有重要影响。茎环结构中的茎部双链区域为蛋白质提供了稳定的结合平台,蛋白质可以通过与茎部的碱基对相互作用,实现与环形RNA的结合。某些蛋白质可以识别茎部特定的碱基序列,通过氢键、范德华力等相互作用与茎部结合,从而影响环形RNA的功能。环部的单链区域则具有较高的柔性,能够与蛋白质形成更灵活的相互作用。环部的核苷酸序列可以与蛋白质的氨基酸残基形成特异性的相互作用,如碱基与氨基酸的侧链基团之间的相互作用,从而决定了蛋白质与环形RNA结合的特异性。一些蛋白质可以通过与环部的特定序列结合,调控环形RNA的稳定性、翻译过程或与其他分子的相互作用。研究发现,某些RNA结合蛋白可以与环形RNA的茎环结构结合,保护环形RNA免受核酸酶的降解,同时影响其在细胞内的定位和功能。假结结构是环形RNA中较为复杂的二级结构,它的存在增加了环形RNA结构的复杂性和稳定性,同时也为其与蛋白质的相互作用提供了更多的可能性。假结结构中的多个茎环相互嵌套,形成了独特的三维结构,这种结构可以提供更多的蛋白质结合位点,增强环形RNA与蛋白质的相互作用。假结结构的稳定性较高,使得蛋白质与环形RNA的结合更加牢固,不易解离。一些蛋白质可以特异性地识别假结结构,与假结中的特定区域结合,从而调控环形RNA的功能。在某些病毒的环形RNA中,假结结构与病毒蛋白的结合对于病毒的复制和感染过程至关重要。假结结构还可能影响环形RNA与其他蛋白质的竞争结合,因为其独特的结构可能会改变蛋白质结合位点的空间构象,影响其他蛋白质的结合能力。除了二级结构特征,环形RNA的三级结构对与蛋白质的相互作用也具有重要影响。三级结构是RNA分子在二级结构基础上进一步折叠形成的三维空间结构,它决定了RNA分子的整体形状和表面性质。环形RNA的三级结构可以通过碱基堆积、离子相互作用等方式形成,使得RNA分子具有特定的空间构象。蛋白质与环形RNA的相互作用不仅依赖于局部的二级结构,还受到整体三级结构的影响。蛋白质需要与环形RNA的特定表面区域相互匹配,才能实现有效的结合。如果环形RNA的三级结构发生改变,可能会影响蛋白质的结合位点和结合方式,从而改变相互作用的亲和力和特异性。一些分子伴侣蛋白可以帮助环形RNA正确折叠形成特定的三级结构,促进其与其他蛋白质的相互作用。五、环形RNA的生物学功能研究5.1作为miRNA海绵的功能5.1.1miRNA海绵作用机制环形RNA作为miRNA海绵发挥作用,主要基于其独特的结构和序列特征,通过竞争性结合miRNA,影响miRNA对靶基因的调控,从而参与基因表达调控网络,在细胞的生理和病理过程中发挥重要作用。miRNA是一类长度约为22个核苷酸的小分子非编码RNA,在基因表达调控中扮演着关键角色。成熟的miRNA与AGO2等蛋白结合形成RNA诱导沉默复合体(RISC),通过碱基互补配对的方式识别并结合靶mRNA分子的3’-UTR区域,抑制靶mRNA的翻译过程,或促使其降解,进而下调靶基因的表达水平。由于miRNA与mRNA的序列互补性决定了其对靶mRNA的特异性识别与作用,且每个miRNA可能与多个mRNA互补结合,因此miRNA可以调控多个基因的表达,广泛参与细胞增殖、分化、凋亡等生命活动。环形RNA之所以能够充当miRNA海绵,是因为其序列中含有多个miRNA结合位点。这些结合位点的核苷酸序列与miRNA的种子序列互补,能够通过碱基互补配对与miRNA特异性结合。当circRNA表达水平升高时,它会与miRNA结合,将miRNA“隔离”,使其无法与靶mRNA结合,从而解除miRNA对靶mRNA的抑制作用,维持靶mRNA的结构和翻译稳定性,导致靶蛋白表达水平上调。相反,当circRNA表达水平降低时,结合的miRNA数量减少,更多的miRNA得以与靶mRNA结合,破坏靶mRNA的结构和翻译稳定性,使得靶蛋白表达水平下调。这种调控方式类似于竞争性内源性RNA(ceRNA)机制,circRNA通过竞争性结合miRNA,调节miRNA对靶基因的调控作用,进而影响基因表达。以CDR1as(小脑变性相关蛋白1的反义转录本)为例,它在哺乳动物大脑中广泛存在,且含有70多个miR-7保守结合位点。CDR1as作为miR-7分子海绵,能够阻断miR-7对下游基因的表达抑制。当CDR1as过表达时,它会结合大量的miR-7,抑制miR-7的活性,从而促进miR-7靶蛋白(如UBE2A、EGFP、PTEN、CCNE1和PIK3CD等)的表达,这些靶蛋白参与中枢神经系统疾病、糖尿病、胃癌、肝细胞癌等疾病的发生发展。5.1.2相关案例分析在癌症研究领域,circPVT1在肝癌的发生发展中展现出重要的调控作用,其机制与作为miRNA海绵密切相关。研究发现,circPVT1在肝癌组织中显著高表达,通过生物信息学分析和实验验证,确定其含有多个miR-125b的结合位点。在正常生理状态下,miR-125b可以与靶基因mRNA的3’-UTR区域结合,抑制其翻译过程,从而调控细胞的增殖、凋亡等生物学过程。当circPVT1在肝癌细胞中高表达时,它大量吸附miR-125b,使miR-125b无法与靶基因mRNA有效结合,解除了miR-125b对靶基因的抑制作用。进一步研究发现,circPVT1通过吸附miR-125b,上调了靶基因SOX4和MCL1的表达。SOX4是一种转录因子,在肝癌细胞中,它可以促进细胞的增殖、迁移和侵袭能力;MCL1是一种抗凋亡蛋白,能够抑制细胞凋亡,增强肝癌细胞的存活能力。因此,circPVT1通过作为miR-125b的海绵,调控相关靶基因的表达,促进了肝癌细胞的增殖、迁移和侵袭,在肝癌的发生发展过程中发挥了重要的促进作用。在心血管疾病研究中,circRNA也发挥着关键作用,以circRNA-100338在心肌梗死中的作用为例。心肌梗死是一种严重的心血管疾病,其发病机制涉及多种生物学过程的异常。研究表明,circRNA-100338在心肌梗死患者的血清和心肌组织中表达显著下调。通过一系列实验,发现circRNA-100338含有miR-122-5p的结合位点,能够作为miR-122-5p的海绵。miR-122-5p在心肌梗死的发生发展中具有重要作用,它可以通过抑制靶基因的表达,影响心肌细胞的增殖、凋亡和能量代谢等过程。在正常情况下,circRNA-100338可以结合一定量的miR-122-5p,维持miR-122-5p对靶基因的适度调控。当circRNA-100338表达下调时,其对miR-122-5p的吸附能力减弱,导致miR-122-5p大量游离,进而过度抑制靶基因的表达。研究发现,miR-122-5p的靶基因包括一些参与心肌细胞能量代谢的关键酶和信号通路分子,如HK2、PFKFB3等。miR-122-5p对这些靶基因的过度抑制,会导致心肌细胞能量代谢紊乱,细胞凋亡增加,最终加重心肌梗死的病情。因此,circRNA-100338通过作为miR-122-5p的海绵,调控相关靶基因的表达,在心肌梗死的发生发展中发挥着重要的调节作用。5.2调控基因转录与表达5.2.1对转录过程的影响环形RNA在基因转录过程中扮演着重要角色,通过多种机制对转录过程进行调控,影响基因表达水平,进而参与细胞的生理和病理过程。环形RNA可以通过与转录因子相互作用,直接影响基因的转录起始和延伸过程。一些环形RNA能够特异性地结合转录因子,改变其活性或定位,从而调控基因转录。circRNA-Foxo3可以与转录因子E2F1和DP1相互作用,形成circRNA-Foxo3-E2F1-DP1复合物,抑制E2F1和DP1的转录激活活性,进而抑制细胞周期相关基因的转录,阻滞细胞周期进程。这种调控作用在细胞增殖、分化和衰老等过程中具有重要意义。在细胞增殖过程中,circRNA-Foxo3对细胞周期相关基因转录的抑制,能够控制细胞的增殖速度,防止细胞过度增殖;在细胞分化过程中,其对转录因子的调控作用有助于细胞向特定方向分化,实现细胞功能的特化。环形RNA还可以通过与RNA聚合酶II(PolII)相互作用,影响基因转录。部分环形RNA能够与PolII结合,促进或抑制其在DNA模板上的结合和移动,从而调控转录的起始和延伸。ci-ankrd52是一种内含子来源的环形RNA,它主要在细胞核中积累,能够通过与RNAPolII的顺式调节作用,促进ANKRD52基因的转录。具体机制可能是ci-ankrd52与PolII结合后,改变了PolII的构象或与DNA模板的结合亲和力,使得PolII更容易起始转录或在转录过程中更稳定地沿着DNA模板移动,从而增加ANKRD52基因的转录产物。这种调控方式在维持细胞的正常生理功能中发挥着关键作用,ANKRD52基因的正常表达对于细胞的结构和功能稳定至关重要,ci-ankrd52通过对其转录的调控,间接参与了细胞的多种生理过程。环形RNA与DNA形成的R-loop结构也对转录过程产生重要影响。R-loop是由RNA与DNA模板链杂交形成的三链核酸结构,在基因组中广泛存在。环形RNA可以与DNA结合形成R-loop,这种结构的形成会影响DNA的结构和功能,进而影响转录过程。在白血病中,circMLL、circMLLT1和circMLLT2等环形RNA在细胞核中大量表达,并与MLL基因及其伴侣基因的基因组位点形成R-loop。这些R-loop的形成促进了RNAPII转录时的暂停现象,同时也促进了DNA双链断裂(DSBs)的产生。DSBs的产生会激活细胞的DNA损伤修复机制,在修复过程中可能会发生错误,导致致癌性染色体易位的发生,从而促进白血病的发展。R-loop还可能影响转录因子与DNA的结合,改变基因的转录活性。当R-loop形成在基因的启动子区域时,可能会阻碍转录因子的结合,抑制基因转录;而在基因的编码区域,R-loop可能会影响RNA聚合酶的移动,导致转录异常。5.2.2在不同生物过程中的调控作用环形RNA在生物的发育过程中发挥着关键的调控作用,对细胞的分化、组织器官的形成和发育进程的调控具有重要影响。在胚胎发育阶段,环形RNA的表达谱呈现动态变化,不同阶段特异性表达的环形RNA参与了相应的发育调控过程。在小鼠胚胎发育过程中,研究发现一些环形RNA在特定的发育时期高表达,通过调控相关基因的转录和表达,影响细胞的分化和组织器官的形成。circ-Sry在雄性小鼠胚胎发育过程中特异性表达,它可以通过与miR-138相互作用,调控下游基因的表达,参与性别决定相关的发育过程。miR-138通常会抑制某些与雄性性别决定相关基因的表达,而circ-Sry作为miR-138的海绵,吸附miR-138,解除其对靶基因的抑制,使得这些基因能够正常表达,从而促进雄性胚胎的发育。在神经系统发育中,环形RNA也扮演着不可或缺的角色。在神经干细胞向神经元分化的过程中,环形RNA的表达和功能变化对神经分化的调控至关重要。研究表明,一些环形RNA在神经干细胞中低表达,随着神经分化的进行,其表达逐渐升高。circRNA-100284在神经干细胞分化为神经元的过程中表达上调,通过调控相关基因的转录,促进神经分化相关基因的表达,抑制神经干细胞相关基因的表达,从而推动神经干细胞向神经元的分化进程。circRNA-100284可能通过与转录因子结合,改变其对神经分化相关基因启动子的结合能力,促进这些基因的转录;同时,它也可能通过与miRNA相互作用,间接调控神经干细胞相关基因的表达。环形RNA的异常表达与多种疾病的发生发展密切相关,在癌症、神经系统疾病等疾病中,环形RNA通过调控基因转录和表达,参与疾病的病理过程。在癌症中,环形RNA可以作为致癌基因或抑癌基因,影响肿瘤细胞的增殖、迁移、侵袭和凋亡等生物学行为。circPVT1在肝癌组织中高表达,通过与miR-125b结合,解除miR-125b对靶基因SOX4和MCL1的抑制,促进这些基因的转录和表达,从而促进肝癌细胞的增殖、迁移和侵袭。SOX4作为转录因子,能够促进肝癌细胞的增殖和转移相关基因的表达;MCL1作为抗凋亡蛋白,能够抑制肝癌细胞的凋亡,增强其存活能力。在神经系统疾病中,如阿尔茨海默病,环形RNA的异常表达也参与了疾病的发病机制。研究发现,一些环形RNA在阿尔茨海默病患者的大脑组织中表达异常,通过调控相关基因的转录和表达,影响神经细胞的功能和存活。circRNA-CDR1as在阿尔茨海默病患者大脑中表达失调,它可以作为miR-7的海绵,调节miR-7对靶基因的调控作用,影响神经细胞的信号传导和代谢过程,从而参与阿尔茨海默病的发病过程。5.3参与蛋白质翻译5.3.1翻译机制研究环形RNA参与蛋白质翻译的机制与传统线性mRNA的翻译过程存在显著差异,它主要通过非帽依赖的翻译机制来实现蛋白质的合成。传统的线性mRNA翻译起始依赖于5'端帽子结构,需要多种起始因子的参与,如eIF4E、eIF4G等,这些起始因子与5'端帽子结合,招募核糖体小亚基,进而启动翻译过程。而环形RNA由于缺乏5'端帽子结构,无法通过经典的帽依赖翻译途径进行翻译。内部核糖体进入位点(IRES)介导的翻译是环形RNA翻译的重要机制之一。IRES是一段特殊的RNA序列,能够直接招募核糖体小亚基,启动蛋白质翻译过程。在环形RNA中,IRES序列通常位于编码区的上游,当核糖体小亚基结合到IRES上后,能够绕过对5'端帽子的依赖,直接开始扫描起始密码子,从而启动翻译。研究表明,一些病毒来源的环形RNA含有天然的IRES序列,能够在宿主细胞中高效地进行翻译。在脊髓灰质炎病毒中,其基因组RNA为环形结构,含有IRES序列,在感染细胞后,能够利用宿主细胞的翻译机器,通过IRES介导的翻译机制合成病毒蛋白。在真核生物中,也有部分环形RNA被发现含有IRES序列,如circ-ZNF609,它可以通过IRES介导的翻译机制编码蛋白质,且该蛋白质在细胞增殖和迁移过程中发挥作用。除了IRES介导的翻译,N6-甲基腺苷(m6A)修饰也在环形RNA翻译中发挥重要作用。m6A是真核生物RNA中最常见的一种修饰方式,它能够影响RNA的稳定性、剪接、转运和翻译等过程。在环形RNA中,m6A修饰可以促进核糖体与环形RNA的结合,增强翻译效率。m6A修饰可以作为一种识别信号,被YTHDF3等m6A结合蛋白识别,这些结合蛋白可以与翻译起始因子相互作用,促进核糖体在环形RNA上的组装,从而启动翻译过程。研究发现,在一些肿瘤细胞中,circRNA的m6A修饰水平升高,其翻译效率也随之提高,翻译产生的蛋白质可能参与肿瘤细胞的增殖、迁移和侵袭等过程。还有研究表明,环形RNA可能通过滚环扩增(RCA)的方式进行翻译。在滚环扩增过程中,环形RNA作为模板,在DNA聚合酶或RNA聚合酶的作用下,不断地进行复制和转录,产生多个线性的RNA分子,这些线性RNA分子可以进一步进行翻译,从而提高蛋白质的合成效率。这种翻译机制在一些病毒感染的细胞中较为常见,如乙肝病毒感染的细胞中,病毒来源的环形

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论