• 第三节 染色质的复制与表达

    一、染色质的复制与修复

    细胞分裂对于生命的维持至关重要(见第十二章)。

    细胞分裂的第一步是遗传信息的复制。遗传信息的复制不仅仅是DNA的复制,同时包括DNA的载体核小体的复制,两者正常复制是染色质复制的基础

    DNA的复制已经研究得比较深入,但在此不予详述(请参考生物化学或分子遗传学的有关教科书)。核小体的复制是如何进行的至今并不清楚。比如,组蛋白及其修饰是否存在半保留复制机制?鉴于近年来表观遗传学研究的快速发展,相信核小体的复制机制也终将被解释。

    (-)染色质的复制

    在真核生物细胞周期的S期,染色质的完全复制不仅需要基因组DNA的复制,也需要把复制好的DNA组装成染色质。普遍认为,在复制叉移动的同时,染色质短暂地解组装,然后在两条复制好的子代DNA链上重新进行组装。新复制的DNA主要通过以下两种途径组装成染色质:第一,在复制叉的移动期间,父代的核小体核心颗粒与DNA分离,到该段DNA复制完成,父代的核小体核心颗粒直接转移到两条子链DNA的一条上;第二,染色质组装因子利用刚刚合成的、乙酰化的组蛋白介导核小体在复制DNA上组装。图9-16显示的是异染色质区域染色质复制的模型以及相关的调节因子。

    (二)染色质的修复与基因组稳定性

    染色质的形成,特别是高度浓缩的染色质结构对基因组DNA(染色质DNA)具有重要的保护作用。然而,即使如此,因为细胞中的染色质DNA随着细胞周期的变化会暴露或部分暴露于其周围环境中,所以,基因组DNA会受到细胞内外化学的与物理的因素的作用而产生突变。这种突变有些是致命的,首先导致相关基因功能的丧失,然后导致细胞的死亡或癌化。不过,细胞中存在一整套的DNA修复机器来应对各种各样的DNA突变(详见第十二章)。细胞一旦丧失了DNA修复的部分或全部能力,细胞的基因组就会变得不稳定。基因组的不稳定性是直接导致肿瘤发生的重要原因之一。

    此外,修复好的DNA必须及时地与组蛋白结合,组装成染色质。否则,裸露的DNA很容易被重新突变或断裂。在修复后的DNA组装成染色质的过程中(这过程称染色质修复, chromatin restoration),染色质组装因子CAF1、组蛋白乙酰转移酶Tip60、染色质重塑因子SWI等起着重要的调节作用。

    二、染色质的激活与失活

    随着20世纪70年代核小体结构的发现,科学家们提出了一个重要问题,那就是RNA聚合酶、转录因子等非组蛋白如何能与同组蛋白核心紧密结合的DNA相互作用?事实上,有证据表明,DNA与核小体组蛋白的结合会阻断DNA与转录因子及基础转录装置的接近,从而阻断了转录的进行。但同时,又有些证据表明,DNA在与组蛋白形成复合物的情况下仍可被转录。

    所以,这其中的关键问题是虽然DNA都被包装成染色质,但染色质存在不同的活性状态。当前染色质结构改变与基因活化的关系的研究主要集中在如下三个方面:

    是如何形成活性染色质,以便RNA聚合酶能起始转录;二是具有转录活性的染色质结构域如何与周围的非活性区域隔离;三是RNA聚合酶如何通过与染色质模板结合进行转录。

    (一)染色质的激活

    染色质的疏松状态源于核小体的结构改变或核小体的解聚。根据核小体结构与功能关系,可能有以下原因:

    1.DNA结构与核小体相位的变化

    和细胞其他部分一样,染色质并不是一个静止的结构,而是一个动态、可塑的蛋白质与核酸组成的复合体。当一个调控蛋白结合到染色质DNA的一个特定的位点上时,不管是在核小体间还是在一个核小体内,染色质都很容易被引发二级结构的改变。这些改变使得其他的一些结合位点与调控蛋白的结合变得要么更加容易,要么更加困难。有证据表明,结合到DNA上的基因调控蛋白能对距离较远的区域产生影响。比如,某特定的转录因子结合到一段离基因编码区较远的增强子序列上后,有利于在该基因较近的TATA盒序列上进行前起始复合体的组装。该复合体一旦组装后,就可以作为转录因子与其他调控因子结合的“靶点”,结果使染色质上某一特定区域从转录非活化状态转变成转录活化状态。细胞似乎具有某些“工具”能撬开被核小体阻断的DNA区域,从而允许转录因子与DNA接触。例如酵母和人类细胞具有一种多亚基复合物 SWISNF,利用ATP水解释放的能量破坏组蛋白-DNA之间的相互作用,使转录因子得以同基因调控区结合(图9-17)。此外,不同的拓扑异构酶能调整DNA双螺旋的局部构象和高级结构的变化,使之超螺旋化或松弛。实验发现,拓扑异构酶Ⅱ抑制果蝇sp基因的转录;拓扑异构酶Ⅰ分布于果蝇多线染色体中具转录活性的基因座上;B型DNA(右旋)变成Z型DNA(左旋),会导致核心组蛋白八聚体与DNA的亲和力降低。核小体并非沿DNA随机分布,而通常是定位在特殊位点。一种情况是基因关键调控元件(增强子和启动子)位于核小体颗粒之外,使之便于与转录因子结合;另一种情况是基因调控元件位于盘绕核心组蛋白的DNA上,则增强子和启动子两种调控元件通过转录因子被联系起来。

    2.组蛋白的修饰

    组成核小体的组蛋白八聚体的N端都暴露在核小体之外,某些特殊的氨基酸残基会发生乙酰化、甲基化、磷酸化或ADP核糖基化等修饰。这些基团修饰的意义:一是改变染色质的结构,直接影响转录活性;二是核小体表面发生改变,使其他调控蛋白易于和染色质相互接触,间接影响转录活性。

    (1)核心组蛋白的赖氨酸残基乙酰化( acetylation)组蛋白的赖氨酸残基乙酰化是核小体变构的一种重要方式。乙酰化后的组蛋白赖氨酸侧链不再带有正电荷,这样就失去了与DNA紧密结合的能力,使相邻核小体的聚合受阻,同时影响泛素与组蛋白H2A的结合,导致蛋白质的选择性降解。H3和H4是蛋白酶修饰的主要组蛋白,它们的乙酰化可能有类似促旋酶( gyrase)的活性,使核小体间的DNA因产生过多的负超螺旋而易于从核小体上脱离,致使对核酸酶敏感性增高,并有利于转录调控因子的结合。负责组蛋白乙酰化的酶已经被鉴定。此外,近年来还发现大量的辅激活子( coactivator)

    具有组蛋白乙酰转移酶( histone acetyltransferase)的功能,将乙酰基从乙酰CoA供体转移到组蛋白特异的赖氨酸残基上(图9-18)。辅激活子作为一种接头蛋白

    在DNA上游位点将转录因子同基础转录装置连接起来。

    通过具有组蛋白乙酰基转移酶活性的辅激活子的作用,特定的启动子可被看做是核小体解体的起始点。由许多激素受体所介导的基因转录可以说明这一途径。当激素受体与DNA上相应的激素应答元件( hormone response element)结合时,同时与CBP辅激活子相互作用,CBP辅激活子使位于核心启动子区的核小体的组蛋白侧链乙酰化,进而打开启动子并促使转录装置的组装,最终导致相关基因的转录。另一个很好的例子是在酵母中激活因子指导的组蛋白N端的超乙酰化。激活因子GCN4(general control nonrepressed protein 4) WDNA Y 合域与其调控基因的上游激活序列UAS( upstream activating sequence)结合,然后它的激活结构域与一些组蛋白乙酰化酶复合物相互作用,GCN5的催化亚基就是这样的乙酰化酶之一。随后对GCN4结合的附近核小体组蛋白N端尾巴的大量乙酰化促使基础转录因子与DNA的结合(图9-19)。

    染色质的乙酰化状态是一种动态过程。细胞内既存在使组蛋白乙酰化的酶即组蛋白乙酰化酶( histone acetylase),也存在使组蛋白去乙酰化的酶即组蛋白去乙酰化酶( histone deacetylase)。组蛋白去乙酰化伴随着对转录的抑制。实际上有许多转录辅助抑制因子( transcriptional co-repressor)作为组蛋白去乙酰化酶而发挥作用。在酵母中,抑制因子能够指导组蛋白N端尾巴的去乙酰化。图9-19显示的是抑制因子UME6的DNA结合域与它所调控的基因的特异的上游控制因子(URS1)相互作用,UME6的抑制结构域RD( repression domain)与SIN3结合,SⅣN3是一个去乙酰化酶复合物的成分之一,RPD3也是这个复合物的成员。

    对URS1附近的组蛋白N端尾巴的去乙酰化使得通用转录因子不能与TATA盒结合从而抑制基因转录。

    (2)组蛋白H1的磷酸化( phosphorylation)组蛋白H1丝氨酸残基的磷酸化主要发生在有丝分裂期,细胞分裂后其磷酸化水平下降到峰值的20%。H1在染色质组装过程中发挥重要作用,它确定核小体的方向,并对30m的螺线管起维持稳定的作用。

    (3)不同组蛋白修饰之间的关系如前所述,乙酰化一般是活性染色质的标志,而甲基化和磷酸化则在活性染色质与非活性染色质中都存在。组蛋白H3K9的甲基化在调节基因表达、染色质组装和异染色质的形成过程中发挥重要作用。然而,H3S10的短暂磷酸化足以使H3K9甲基化引起的染色质浓缩变得疏松。这是一个两种组蛋白修饰同时调节染色质组装状态的典型例子:稳定的甲基化和动态的磷酸化标记。

    3.HMG蛋白的影响

    高速泳动族非组蛋白HMG1和HMG2有A、B和C三个结构域:A、B结构相似,C含有酸性的羧基端尾部,与结合。RNA聚合酶I相关的转录因子UBF的DNA结合域是85个氨基酸残基的重复区,与HMG1和HMG2的A、B结构相似,所以这种特征性

    结构被命名为“HMG”结构域。与这一结构域相应的DNA序列称为“ hMG bOX”,而具有一个或多个HMG结构域的蛋白质称为HMG结构域蛋白。HMG结构域蛋白有细胞特异性,根据结构域拷贝数、序列识别特性和演化关系等分为两个亚簇:一个亚簇广泛存在于各种细胞中,如HMG1和HMG2,UBF(RNA聚合酶I的转录因子)。该类蛋白一般有多个HMG结构域,没有DNA识别特异性,执行不同的功能。另一个亚簇只存在于特定的细胞中,能识别特异的DNA序列,只有一个HMG结构域,如淋巴细胞增强子结合因子LEF1(1 ymphold enhancer binding factor 1). TCF(T-cell factor 1)FA SRY(sex determining region of the Y chromosome)。

    HMG结构域蛋白结合在DNA双螺旋的小沟中,以40倍的优势选择富含嘧啶的核苷酸元件。HMG结构域蛋白的功能之一是与DNA弯折和DNA-蛋白质复合体高级结构的形成有关。研究发现,HMG结构域可识别某些异型的DNA结构,使DNA链产生90

    130°的弯折。一般来说,150bp的DNA双链很难自发形成环状结构,但在非特异的HMG1存在时,可改变DNA双螺旋结构而形成66bp的DNA环。具转录活性的核小体常缺乏H1,但有非组蛋白HMG14、HMG17存在。在爪蟾中发现HMG17会促进RNA聚合酶Ⅲ的转录,HMG14则直接参与RNA聚合酶Ⅱ对染色质中基因的转录。

    二)染色质的失活

    1.X染色体失活

    通过比较有活性的X染色体(X)与失活的X染色体(X),我们可以发现:雌性哺乳动物中失活的Ⅹ染色体上的H4组蛋白不发生乙酰化,而雄性中有活性的X染色体上的H4都是乙酰化的,前者不表达,后者表达。用乙酰化H4的抗体标记人和小鼠的中期染色体除X外,其他染色体都被标记,所以中期染色体上H4乙酰化程度的高低,可代表基因转录活性的高低。据推算H2B、H3、H4可能具有30多种不同的乙酰化方式,而每种乙酰化方式都可能使核小体结构发生改变,或使核小体上供结合蛋白识别的表面发生变化,从而对转录起始复合体的组装起不同的作用。

    在小鼠胚胎发育的早期是来自父方的X染色体(X)失活,这一过程似乎是印记( Imprinting)而来到囊胚期以后,原先失活的ⅹ重新被激活。之后,来自父方的X与来自母方的X染色体Xm二者之一随机失活。这一过程依赖于一种独特的非翻译RNA(X或X染色体失活特异性转录本)的活性(图9-20)。XRNA覆盖于某一X染色体的表面并使之失活,其机制至今仍不清楚。早期X的失活也与X的活性有关,同时伴随着组蛋白H3K4的大量甲基化和H3K9的乙酰化。当大量 Polycomb类蛋白在X染色体上聚集后,H3K27也发生甲基化。到目前为止,X染色体失活的调节过程仍然不清楚。

    2.位置花斑效应

    基因表达有位置效应,有的活性基因转位到异染色质区附近时会失活。这一现象称为位置花斑效应( position effect variegation)。位于抑制状态与活化状态的染色质结构域之间、能防止不同状态的染色质结构域的结构特征向两侧扩展的染色质DNA序列,称为隔离子( ( insulator)。研究表明,隔离子可能有以下作用:

    是作为异染色质定向形成的起始位点;二是作为结构域两端的锚定点,提供拓扑隔离区,使结构域外的增强子成分不能进入;三是涉及追踪机制,远端增强子处组成的复合体沿染色质模板运动直到启动子,而隔离子可阻止这个复合体超越正常作用范围。虽然三种作用模式均不能满意地解释所有观察到的隔离子现象,但却提示隔离子是以不同方式行使功能的。果蝇中SCS( specialized chromosome structure)是一段250-300bp的DNA序列,插入启动子与增强子之间可阻断来自增强子的转录激活作用。

    三、染色质与基因表达调控

    )以染色质为模板的转录

    真核细胞中基因转录的模板是染色质而不是裸露的DNA,因此染色质呈疏松或紧密结构,即是否处于活化状态是决定RNA聚合酶能否有效行使转录功能的关键现在普遍认为,转录起始伴随着染色质上某一基因调节序列内部或者周围的结构改变。某些情况下,如在两栖类卵子发生过程中,rRNA基因进行活跃转录时,染色质DNA似乎没有核小体。不过,研究发现大多数转录基因仍然保留了它们的核小体,即使有RNA聚合酶沿着DNA模板移动也是如此。RNA聚合酶是一个大分子差不多有两个核小体那么大。它和大约50 bp DNA结合,而且还不能有损伤。因此DNA模板不太可能牢固地结合在未解开的核小体的核心结构上而被转录。RNA聚合酶被认为是用“核小体犁”( nucleosome plow)来克服这一障碍的,即用“核小体犁”来解除组蛋白和DNA间的相互作用。图9-21给出了一种模式,描绘了转录过程在有核小体存在时是如何进行的。目前,上述过程还有许多问题留待解决,比如 SWISNF复合物何时停止工作?谁将转录过的染色质重新组装起来?等等。

    (二)转录因子介导的基因表达调控

    DNA序列对转录的调节,并不依靠DNA本身,而是依靠特异识别这些DNA序列并与之结合的蛋白质,这些蛋白质叫做转录因子( ascription factor)。转录因子从功能上可分为两类:通用转录因子( general transcription factor),与结合RNA聚合酶的核心启动子位点结合;特异转录因子( specific transcription factor)与特异基因的各种调控位点结合,促进或阻遏这些基因的转录。

    有了通用转录因子和RNA聚合酶,基因就可以开始转录了。但一般情况下,真核生物的基因转录还需要其他蛋白因子的参与,以帮助通用转录因子和RNA聚合酶在染色质上组装。这些辅助因子通常与DNA元件结合,这些DNA元件称为增强子( enhancer)。因为它们的存在能够显著加强目的基因的转录。增强子有的位于启动子附近,也有一些增强子距离启动子相当远,甚至可以相距几千碱基。增强子没有方向性,无论在启动子的上游或下游,都可以增强基因转录。

    像大多数蛋白质一样,在转录水平上参与基因表达调控的转录因子也含有不同的结构域。典型的转录因子至少包括两个结构域:DNA结合域(DNAbinding domain),结合特异的DNA序列;激活结构域( activation domain),激活转录。此外,许多转录因子还含有一个促进该蛋白与其他蛋白形成二聚体的表面。二聚体的形成是许多不同类型转录因子的共同特征,在基因表达调控中起重要作用。

    除了激活转录的转录因子之外,还有一些转录因子起抑制基因转录的作用。编码这些转录因子的基因发生突变,会导致某些基因的转录失控,由调节型表达变为组成型表达。果蝇和线虫中都曾经发现这类突变,造成胚胎中本来不应该表达的基因发生转录,导致胚胎发育异常。转录抑制因子(transcriptional repressor)在功能上与转录激活因子正好相反,它们结合于特定的DNA调节序列,抑制结合区附近的基因转录。在结构上,转录抑制因子也是由两部分组成,即DNA结合域和抑制结构域( repression domain)。它的活性也受到其他蛋白质的调控。激活与抑制转录因子的作用决定了某个基因在组织甚至细胞水平表达的特异性,即某个基因可能在同一组织的某些细胞中表达,而同时在另外一些细胞中不表达(图9-22)。

    转录因子的DNA结合域之所以能够识别并结合特异的DNA序列,是因为这些蛋白质的表面与DNA双螺旋的特定区域有特异的亲和性,亲和性的大小决定于DNA序列。蛋白质与DNA结合的机制,在于蛋白质插入DNA分子的大沟,与某些碱基对以氢键、离子键或疏水力等相互作用。蛋白质和DNA之间的结合强度取决于这类非共价键的数量。如果这些非共价键形成较多,蛋白质与DNA之间就可以形成很强的结合,这也决定了蛋白质识别DNA序列的特异性。

    虽然蛋白质与DNA的结合方式千差万别,但是它们都需要形成某些特殊的空间结构,以结合DNA双螺旋的大沟。这些结构称为DNA结合基序( dNA binding moif)。转录因子中最常见的几种基序(结构模式),包括“锌指”( zinc finger)、“螺旋一转角一螺旋”( helixtur- helix)、“亮氨酸拉链”( leucine zipper)结构和同源异型结构域。同源异型结构域由三段α螺旋组成,属于“螺旋一转角一螺旋”家族。从真菌到各种动植物,在调节不同类型细胞活动的大量蛋白质中都发现了这些结构模式。值得注意的是,尽管转录因子是调节基因表达的重要因素,但它并不是唯一的调控机制。细胞还存在其他调控基因转录的机制,比如DNA的甲基化。

     

    (三)DNA甲基化介导的基因表达调控

    现有研究发现,DNA甲基化( DNA methylation)与基因表达的阻遏有关。对哺乳动物及其他脊椎动物的DNA研究表明,每100个核苷酸就有一个含有甲基基团,并且通常是结合在胞嘧啶的5C位上。这种简单的化学修饰被认为是一种“标记”,使特定的DNA区域与其他区域区别开来。几乎所有的甲基化胞嘧啶残基都出现在对称序列( symmetrical sequence)的5-GC-3′二核苷酸上。这种序列在DNA上并不是随机分布,而是集中于富含GC的区域,这种区域称为“GC岛”( GC rich island)。GC岛常位于转录调控区或其附近,它的甲基化程度直接影响转录的活性。

    般而言,非活跃转录基因的DNA甲基化程度普遍高于活跃转录的基因;当含有甲基化DNA的非活性基因活化后,通常伴随失去许多甲基基团。在发育过程中,处于活化状态的基因调节区的甲基化水平会显著下降。例如,与其他组织相比,婴儿肝细胞DNA中位于γ-球蛋白基因上游区域的甲基化水平显著降低。造成这种差异的原因是在婴儿发育期,这个基因处于高水平转录状态。许多研究证据表明,DNA甲基化对维持基因长期处于非活化状态起重要作用。比如雌性哺乳动物失活的X染色体中,DNA就是高度甲基化的。因此甲基化是使DNA转入持久遏制状态的重要条件。

    甲基化作用通过两种方式抑制转录:一是干扰转录因子对DNA结合位点的识别,二是将转录激活因子识别的DNA序列转换为转录抑制因子的结合位点。不过需要指出的是,DNA甲基化和去甲基化与基因活性的关系并不是绝对的。DNA甲基化也不是使基因表达失活的一种普遍机制。动物种属之间DNA甲基化的程度有很大差别。脊椎动物尤其是哺乳动物比无脊椎动物甲基化程度高得多。无脊椎动物,如果蝇和其他双翅目昆虫,细胞中DNA甲基化水平可能很低。这说明DNA甲基化是一种演化事件,并随演化程度的提高而逐步增强。因此,甲基化和去甲基化在基因表达活性调控中的意义依生物不同而有差异。

    基因组印记( genomic imprinting)是哺乳动物所特有的现象,是说明甲基化作用在基因表达调控中具有重要意义的最好例证。直到20世纪80年代中期人们还认为,子代基因组中来自父亲的一套染色体和来自母亲的套染色体在功能上是等价的。但事实并非如此。在哺乳动物发育早期,某些特定基因是活化还是失活仅仅依赖于它们是被精子还是被卵子带入受精卵。例如,在小鼠的早期发育中,编码类胰岛素生长因子2( insulin-ike growth factor2,IGF2)的基因只在由父亲传递下来的染色体上有活性。而编码这种蛋白质的受体(IGF2R)的基因,只在由母亲传递下来的染色体上有活性。这些类型的基因被认为是按照其亲本的来源带上印记。据估计,哺乳动物的基因组含有超过100个这类基因。

    DNA甲基化在基因组印记中具有重要作用。在某情况下,甲基化不足的基因是有活性的;在另一些情况下,含有额外甲基的基因是有活性的,而甲基化不足的模板是无转录活性的。印记基因的这些差异,不受在早期胚胎中出现的去甲基化和复甲基化的影响。当个体产生配子(精子或卵)的时候,从亲本遗传来的印记才消除。

    (四)组蛋白修饰介导的基因表达调控

    真核生物转录因子调节基因转录的一种重要机制,就是调整染色质的结构,以影响通用转录因子对启动子的结合能力。我们都知道,真核生物的遗传物质是以染色质而不是裸露DNA的形式存在于细胞核中。染色质的基本组成单位是核小体,它是由约147bp长的DNA缠绕在组蛋白核心上形成的。如果基因的启动子位于核小体当中,则组蛋白核心会阻碍通用转录因子在启动子上的组装以及RNA聚合酶与启动子的结合,基因转录就无法进行。转录因子能够调节组蛋白核心的结构,从而改变核小体和染色质的紧密程度,影响

    通用转录因子和RNA聚合酶对启动子的结合,调控基因的表达。

    转录激活因子的存在,通常有利于那些导致染色质或组蛋白结构松散的蛋白质复合物发挥作用,如组蛋白乙酰化酶。每种组蛋白的N端以及组蛋白H2A的C端,都从核小体表面向外伸出,称为组蛋白尾。这些组蛋白的尾部能够被某些酶可逆修饰,从而改变核小体的结构。其中组蛋白乙酰化酶对组蛋白H3和H4的修饰对核小体结构的调节起了最重要的作用(详见本章前文)。转录抑制因子通常会加强那些促进染色质结构紧密的蛋白质的作用,如组蛋白去乙酰化酶。它的作用与乙酰化酶正好相反,使核小体结构更紧密,转录起始复合物越发难以结合到启动子上。因此,染色质结构紧密的地方,往往也是基因转录活性很低的地方,这可能就是为什么不活跃的基因常常和异染色质相联系的原因。然而,异染色质区的基因(这类基因虽然不多,但确实存在)的正常表达则依赖于异染色质结构的存在。

    (五)染色质与表观遗传2003年6月15日,包括中国在内的6个国家(美国、英国、法国、德国、日本和中国)的领导人在美国华盛顿宣布人类基因组计划完成。至今,我们已经清楚地知道了从大肠杆菌到线虫、果蝇、小鼠等几种模式生物以及人类的基因组序列。但是了解基因的序列,并不代表了解了生命的奥秘,更不意味着我们可以用这些基

    因去重构生命,尽管任何生物的DNA都编码了该生命体的细胞和机体构建以及生命活动的进行所需要的全部信息。生物之所以成为生物,除了它包含遗传信息外,更重要的是它要恰如其分地使用这些遗传信息,在正确的时间、正确的位置来正确地表达或关闭某些遗传信息表观遗传现象最早是摩尔根的学生H.J. Muller在1930年研究Ⅹ射线诱导的染色体重组时发现的。当时他称自己得到的红白嵌合眼果蝇是“位置花斑效应”现象。20世纪40年代,C. Waddington提出了表观遗传的概念:基因与环境相互作用产生的可遗传表型。随后科学家们发现了一系列类似的现象,如20世纪50年代麦克林托克(B. McClintock)第一次将染色体位置效应与玉米中染色体上不同位置的突变频率联系起来,20世纪60年代M.Lyon发现的哺乳动物雌性个体细胞中Ⅹ染色体失活现象。后来,科学家们发现了DNA的甲基化与基因表达的关系,脊椎动物细胞中的染色体印记现象,酵母细胞中的端粒沉默( telomeric silencing)现象等。不过,从最初的表观遗传现象发展至现今的表观遗传学领域还得归功于十几年以前开始发现的一系列组蛋白修饰酶—乙酰化酶、去乙酰化酶、甲基化酶、去甲基化酶、磷酸化酶、磷酸酶、泛素化酶、去泛素化酶等,以及这些酶与一些染色质重塑因子之间的相互作用等中心法则,即遗传信息从DNA到RNA再到蛋白质,是遗传学的基础,也是孟德尔遗传规律的根本。这也就是我们通常所说的基因型(DNA序列)决定表型(性状)。然而,自然界的许多生命现象却很难用孟德尔规律去解释。如双胞胎、克隆猫、肿瘤组织等,虽然它们的DNA序列是一样的,却经常有很大的表型上的差异。现在已知,这些差异是由表观遗传的修饰不同造成的。如肿瘤细胞中DNA甲基化的变化使得抑癌基因失活。表观遗传现象在哺乳类、果蝇、酵母及植物中都广泛存在。值得指出的是,表观遗传修饰在干细胞的分化以及体细胞的去分化过程中发挥着举足轻重的作用。遗传学的变化是通过DNA序列的突变实现的,通过生殖细胞得以遗传。表观遗传的变化是通过组蛋白和DNA的不同修饰而实现的。表观遗传修饰可以遗传但富于变化,它是通过改变染色质的结构而改变基因组信息的表达。这些可改变染色质结构的途径主要包括:各种组蛋白修饰共同构成组蛋白密码子( histone code)、染色质重塑( chromatin remodeling)、组蛋白异型体( (histone variant)、DNA甲基化和非编码RNA( noncoding RNA)的作用。这些染色质上的各种标记可以在细胞分裂过程中被遗传下去。它们共同构成特定细胞在特定时期的表观基因组( epigenome)

    四、染色质的三维动态分布与细胞D

    染色质在细胞核内的分布并不是均匀的,也不是静止不变的,而是存在时间和空间上的特异性。这一特异分布的特性与细胞内的基因表达有关,更与细胞的状态直接相关。根据这一特性,如果能够实时地检测和显示细胞核内染色质的分布模式,我们就可以确定该细胞的身份( (identity,D)。知道了每个细胞的ID可以帮助我们确定该细胞的状态,从而可以知道它的下一步“前进”方向。如果发现“异常”细胞,我们就可以将它们及时地从机体内清除出去,以保证正常细胞行使功能和机体生命的正常进行。这对机体发育和人类健康的维持将会发挥至关重要的作用。

     

    这一想法在2014年之前是不可想象的。基于CRISPR/Cas9的DNA序列标记技术(参见知识窗2-3)的建立结合活体生物成像技术的应用为我们实现建立细胞ID的想法提供了可能。2013年底B.Chen等人用GFP标记的Cas9蛋白通过一段g( guide RNA)在活体细胞中特异地显示一段基因组DNA相连的染色质在细胞核内的三维分布。他们发现这段DNA(或基因)相关的染色质的三维分布是动态变化的。这种变化跟细胞周期的变化直接相关。基于这些观察,我们设想有可能根据某些标志性DNA序列的三维分布建立各类细胞ID标准化信息库,为将来有可能利用这一信息库为人类健康服务打下基础。