博客网 加入收藏  -  设为首页
您的位置:博客网 > 养生 > 正文
LncRNA 概述
LncRNA 概述
提示:

LncRNA 概述

表观遗传学是研究基因表达发生了可遗传的改变,而DNA序列不发生改变的一门生物学分支,对细胞的生长分化及肿瘤的发生发展至关重要。表观遗传学的主要机制包括DNA甲基化、组蛋白修饰及新近发现的非编码RNA。非编码RNA是指不能翻译为蛋白的功能性RNA分子,其中常见的具调控作用的非编码RNA包括小干涉RNA、miRNA、piRNA以及长链非编码RNA。研究者的大量研究表明非编码RNA在表观遗传学的调控中扮演了越来越重要的角色。

在近十余年的生命科学研究中非编码调控RNA可谓是研究最火的领域之一,从2006年诺奖的siRNA,到这几年异常火爆的microRNA,到即将登场并定能风靡的lncRNA,可谓如火如荼。RNA不仅仅只承担遗传信息中间载体的辅助性角色,而是更多地承担了各种调控功能。

lncRNA在发育和基因表达中发挥的复杂精确的调控功能极大地解释了基因组复杂性之难题,同时也为人们从基因表达调控网络的维度来认识生命体的复杂性开启新的天地。研究者大部分研究集中于短 RNA如 microRNA,piRNA 等一些 ncRNA 生物生成机制和调控通路,甚至在一些人类复杂疾病中的功能,但是这都只是冰山一角。人们对lncRNA(Long noncoding RNAs,lncRNAs)的认识还处在初级阶段,lncRNA起初被认为是基因组转录的“噪音”,是RNA聚合酶II转录的副产物,不具有生物学功能。然而,有文献研究表明,lncRNA参与了X染色体沉默、基因组印记以及染色质修饰、转录激活、转录干扰、核内运输等多种重要的调控过程。lncRNA的这些调控作用也开始引起人们广泛的关注。

哺乳动物基因组序列中,4%~9%的序列产生的转录本是lncRNA(相应的蛋白编码RNA的比例是1%)。虽然关于lncRNA的研究进展迅猛,但是绝大部分的lncRNA的功能仍然是不清楚的,随着研究的推进,各类lncRNA 的大量发现,lncRNA 的研究将是RNA 基因组研究非常吸引人的一个方向,使人们逐渐认识到基因组存在人类知之甚少的“暗物质”。

近年来lncRNA得到了研究界的广泛关注,人们已经在测序技术的帮助下鉴定了大量lncRNA,但lncRNA的生物学功能依然迷雾重重。

西班牙IMIM(Hospital del Mar Medical Research Institute)和加泰罗尼亚理工大学(UPC)的研究团队最近在eLife杂志上发表研究指出,长非编码RNA在新蛋白演化中起到了重要的作用,它们在细胞中有着不为人知的重要功能。长非编码RNA是指长度超过三百个核苷酸的RNA分子,其上没有编码蛋白的阅读框。在细胞内lncRNA的丰度约占到70%至98%,有些lncRNA甚至长达几千bp。虽然lncRNA没有编码任何蛋白质,但它们的表达在不同组织和发育阶段依然具有特异性,这说明lncRNA具有重要的生物学意义。绝大多数lncRNA位于细胞核,它们对应的DNA区域有的与蛋白编码基因重叠,有的位于基因之间或者内含子中。由于lncRNA似乎没有承担什么生物学功能,它们曾被认为是一种“进化噪声”。现在西班牙的研究人员通过新测序技术向人们展示,许多这样的转录本也有机会翻译成为蛋白。这一发现旋即引起了激烈的争论。

Mar Albà等人在六个物种中(人类、小鼠、鱼、果蝇、酵母和一种植物)验证了这一结果,许多lncRNA与核糖体关联,似乎随时准备翻译成为蛋白。这说明,lncRNA可以成为新蛋白合成的资源。这项研究显示,大多数lncRNA是种系特异性的,很少有lncRNA存在于两个以上的物种中。由此可见,这些lncRNA很可能是最近才演化出来的。事实上,lncRNA分子表现出许多与“年轻”基因相似的特性。新功能性蛋白的出现,是一个反复尝试的过程。因此细胞需要生成大量的转录本,这些转录本不一定都能通过时间的检验。lncRNA与这样的转录本很相符。对近亲物种进行研究,将有助于我们进一步理解新基因的形成机制,鉴定那些可能有功能的转录本。lncRNA表达模式改变与特定疾病的关联,也是一个很有吸引力的研究方向。

随着lncRNA功能逐步显现,其与靶点的作用机制成为进一步的热点。早期认为原位调控是lncRNA 作用的唯一机制,它通过招募形成染色质修饰复合物而沉默邻近基因转录,例如IGF2R 反义RNA(antisense of IGF2R RNA,AIR)、XIST 等。而Hox 基因反义基因间RNA(Hox antisense intergenicRNA,HOTAIR)的发现提示lncRNA可能存在远程调控。

同源异型基因(homeotic genes,HOX)在细胞增殖与定向分化中起关键作用,人类Hox 基因簇约含100个ncRNA 基因,其中HOTAIR 定位于HOXC 基因座12q13.13。HOTAIR的5'端可招募结合多梳蛋白抑制复合物2(polycomb repressivecomplex 2,PRC2),借助PRC2上三个H3K27甲基化酶EZH2、SUZ12和EED,使另一基因座HOXD上长约40 kb的序列转录沉默,从而在乳腺上皮细胞内使细胞内转录倾向于胚胎成纤维细胞样表型。超过20%的lncRNA 能够通过结合PRC2或其他类似复合物发挥作用,提示lncRNA的远程调控机制在生物体内广泛存在。

长链非编码RNA的作用机制非常复杂,至今尚未完全清楚。根据目前的研究,lncRNA的作用机制如要有以下几种。

(1)编码蛋白的基因上游启动子区(橙色)转录,干扰下游基因(蓝色)的表达;

(2)抑制RNA聚合酶II或者介导染色质重构以及组蛋白修饰,影响下游基因(蓝色)的表达;

(3)与编码蛋白基因的转录本形成互补双链(紫色),干扰mRNA的剪切,形成不同的剪切形式;

(4)与编码蛋白基因的转录本形成互补双链(紫色),在Dicer酶的作用下产生内源性siRNA;

(5)与特定蛋白质结合,lncRNA转录本(绿色)可调节相应蛋白的活性;

(6)作为结构组分与蛋白质形成核酸蛋白质复合体;

(7)结合到特定蛋白质上,改变该蛋白质的细胞定位;

(8)作为小分子RNA(如miRNA、piRNA)的前体分子。




目前,发现的参与哺乳动物基因活动的lncRNA已有上千个,其调控基因表达的机制存在共性。一般来说,lncRNA主要从表观遗传学、转录调控及转录后调控等3个层面实现对基因表达的调控。




1 . 表观遗传调控

哺乳动物lncRNA介导的表观遗传改变的研究,最早源于基因组印记(genomic printing)和X染色体失活(X chromosome inactive)两个方面,分别与H19和X ist RNA密切相关。近十年研究证实,lncRNA与表观遗传调控密切相关,并且发现了许多新的与基因调控有关的lncRNA。

2.  转录调控




LncRNA能够通过多种机制在转录水平进行调控,表现在如下几个方面:

LncRNA的转录可以干扰邻近基因的表达。例如,酵母的SER3基因受到上游一段lncRNA——SRG1的干扰。近端启动子转录的lncRNA可将RNA结合蛋白定位至基因启动子区域从而调控基因表达。如,人类细胞中的细胞周期蛋白D1(CCND1)的表达,DNA损伤信号诱导该基因启动子上游一段lncRNA的表达,它可调节RNA结合蛋白——TLS的活性,接着TLS抑制CREB结合蛋白——组蛋白乙酰基转移酶和p300的活动,进而使CCND1基因的表达沉默。

LncRNA可作为共因子调节转录因子的活性。例如,小鼠的一段lncRNA——Evf2转录自一段超保守的远端增强子,它可与转录因子DLX2形成转录复合体,并结合至一个增强子上,从而诱导邻近蛋白编码基因DLX6的表达。通过与影响启动子选择的抑制性复合物相互作用,封锁启动子区域来调控RNA聚合酶(RNAP)II的活动从而干扰基因表达。这可能是存在于真核细胞染色体上的上千种三倍体复合物结构控制启动子作用的普遍机制。

再如,小鼠17号染色体的Igf2r区是第一个被证实的可转录为 lncRNA的位点,父系染色体上一未拼接的 lncRNA——A irn从母源性Igf2r上的ICR区域开始转录,方向与Igf2r相反。这一反义链转录的RNA规模较大,跨越整个Igf2r启动子。并越过基因间区抵达邻近基因。属于一种转录干扰机制。

3 . 转录后调控




LncRNA在转录后水平可与mNRA形成双链RNA复合物,以掩盖mRNA的主要顺式作用元件,从而调控基因表达。例如,lncRNA-Zeb2(即Sip1)能够和HOX位点转录的mRNA的一个内含子的5’端剪切位点形成双链,从而防止该内含子被剪切。该区域含有对于Zeb2蛋白表达所必须的核糖体结合位点,Zeb2通过这种方式能够提高Zeb2蛋白的表达量。这一例子说明lncRNA可以指导mRNA亚型的选择性剪接。

另外,lncRNA的复性(退火)具有靶向作用,使蛋白受体复合物能够识别正义链mRNA转录本。这一租用类似于RNA诱导的沉默复合物(RISC)通过siRNA靶向作用于mRNA。来自于互补转录本甚至是lncRNA的双链RNA,结合延长的内部发夹结构,能够被加工成内源性siRNA以使基因表达沉默。

RNA-seq名词解释(1)
提示:

RNA-seq名词解释(1)

RNA-seq即 转录组测序 技术,就是用 高通量测序 技术进行测序分析,反映出mRNA,smallRNA,noncodingRNA等或者其中一些的表达水平。RNA测序最经常用于分析差异表达基因(DEG)。 转录组 是某个物种或者特定细胞类型产生的所有转录本的集合。转录组研究能够从整体水平研究基因功能以及 基因结构 ,揭示特定生物学过程以及疾病发生过程中的分子机理,已广泛应用于基础研究、临床诊断和药物研发等领域。 gene :具有编码蛋白质或决定某一性状作用的一段核酸序列。 Q20,Q30 :Phred 数值大于 20、30 的碱基占总体碱基的百分比,其中 Phred=-10log10(e). intron :内含子,是真核生物细胞 DNA 中的间插序列。这些序列被 转录在前体 RNA 中,经过剪接被去除,最终不存在于成熟 RNA 分 子中。术语内含子也指编码相应 RNA 内含子的 DNA 中的区域。 exon :外显子,是真核生物基因的一部分,它在剪接(Splicing)后仍会被保存下来,并可在蛋白质生物合成过程中被表达为蛋白质。外显子是最后出现在成熟 RNA 中的基因序列,又称表达序列。既存在于最初的转录产物中,也存在于成熟的 RNA 分子中的核苷酸序列。术语外显子也指编码相应 RNA 外显子的 DNA 中的区域。 intergenic :基因间区,指基因与基因之间的间隔序列,不属于基因结构,不直接决定氨基酸,可能通过转录后调控影响性状的区域。 UTR :Untranslated Regions, 非翻译区域。是信使 RNA(mRNA)分子两端的非编码片段。5'-UTR 从 mRNA 起点的甲基化鸟嘌呤核苷酸帽延伸至 AUG 起始密码子,3'-UTR 从编码区末端的终止密码子延伸至多聚 A 尾巴(Poly-A)的前端。 transcript :转录本,是由一条基因通过转录形成的一种或多种可供编码蛋白质的成熟的 mRNA。一条基因通过内含子的不同剪接可构成不同的转录本。 isoform :同一个基因经可变剪切或内含子选择机制产生不同的转录本,这些不同转录本即称 isoform。 reconstruction:重组,由于不同 DNA 链的断裂和连接而产生 DNA片段的交换和重新组合,从而形成新 DNA 分子。plus strand/minus strand:正链/负链。对于一个基因来说,DNA 的两条链中有一条链作为 RNA 合成时的模板,这条链叫负链,另一条叫正链。 antisense strand/sense strand :无义链/有义链。模板链在双链 DNA中,用来转录 mRNA 的 DNA 链称为模板链(template strand),不用于转录的链则称为非模板链(nontemplate strand)。根据碱基互补配对原则,转录出的 mRNA 链的碱基序列与非模板链的碱基序列一致,惟一不同的是,非模板链中的 T 在 mRNA 链中全部置换成了 U。正是由于非模板链的碱基序列实际上代表了 mRNA 的碱基序列(只不过在 mRNA 中 T 换成了 U),因此非模板链又被称为编码链(coding strand),有义链(sense strand)和克里克链(crick strand),而用来转录mRNA 的 DNA 链被称为非编码链(anticoding strand)或无义(antisense strand)或沃森链(watson strand)。 gene family :基因家族。真核细胞中,许多相关的基因常按功能成套组合,被称为基因家族。它们来源于同一祖先,由一个基因通过基因重复产生两个或更多的拷贝而构成的一组基因,它们在结构和功能上具有明显的相似性,编码相似的蛋白质产物。 gtf/gff :基因结构注释文件。gtf(gene transfer format)指包含基因特 征的注释文件,而 gff(general feature format)是指包含基因组特征 的注释文件。 ORF :open reading frame,开放阅读框或开放读码框。是结构基因的正常核苷酸序列,从起始密码子到终止密码子的阅读框可编码完整的 多肽链,其间不存在使翻译中断的终止密码子。 reference genome/ reference :参考基因组。RNA-seq 有参分析的基础。 small RNA :是长度大约在 18-30bp 的非编码 RNA 分子,包括 micro RNAs、siRNAs 和 pi RNAs,是生命活动重要的调控因子,在基因表达调控、生物个体发育、代谢及疾病的发生等生理过程中起着重要作 用。 ncRNA :non-coding RNA,非编码 RNA。指不编码蛋白质的 RNA。其中包括 rRNA,tRNA,snRNA,snoRNA 和 microRNA 等多种已知功能的 RNA,及未知功能的 RNA。其共同特点是都能从基因组上转录而来,不需要翻译成蛋白即可在 RNA 水平上行使各自的生物学功能。 lncRNA :long noncoding RNA,长链非编码 RNA。长度在 200-100000nt之间,不具有编码蛋白功能的转录本。根据与编码基因的位置关系可分为:Antisense lncRNA (反义长非编码 RNA)、Intronic lncRNA (内含子长非编码 RNA)、Long intergenic noncoding RNA (基因间区长非编码 RNA)、Sense lncRNA(正义长非编码 RNA)、Bidirectional lncRNA(双向长非编码 RNA)。 参考链接: RNA-seq_百度百科 (baidu.com)