• 第二节 染色质

    染色质( chromatin)是遗传物质的载体。1879年,Flemming提出了染色质这一术语,用以描述细胞核中能被碱性染料强烈着色的物质。1888年,W.von Waldeyer-Hartz正式提出染色体的命名。经过一个多世纪的研究,人们认识到,染色质和染色体是在细胞周期

    不同阶段可以互相转变的形态结构。

    染色质是指间期细胞核内由DNA、组蛋白、非组蛋白及少量RNA组成的线性复合结构,是间期细胞遗传物质存在的形式。染色体是指细胞在有丝分裂或减数分裂的特定阶段,由染色质聚缩而成的棒状结构。实际上,二者之间的区别主要并不在于化学组成上的差异,而在于包装程度不同,反映了它们在细胞周期不同的功能阶段中所处的不同的结构状态(图9-7)。在真核细胞的细胞周期中,大部分时间是以染色质的形态而存在的。

    如果说细胞核是细胞遗传与代谢的调控中心,那么这个中心最重要的成员便是染色质。几乎所有细胞生命活动都要从染色质开始。我们知道细胞的生长、分裂甚至衰老与死亡都是受基因控制的,而细胞内基因存在与发挥功能的结构基础是染色质。与基因组直接相关的细胞活动都是在染色质水平进行的,如DNA复制、基因转录、同源重组、DNA修复,包括转录偶联的修复( transcription coupled repair)以及DNA和组蛋白的各种修饰(图9-7)。这些修饰包括甲基化、乙酰化、磷酸化、亚硝基化和泛素化等。

    通过分离胸腺、肝或其他组织细胞的核,用去垢剂处理后再离心收集染色质进行生化分析,确定染色质的主要成分是DNA和组蛋白,还有非组蛋白及少量RNA。大鼠肝细胞染色质常被当做染色质成分分析模型,其中组蛋白与DNA含量之比近于1:1,非组蛋白与DNA之比是0.6:1, RNA/DNA比值为0.1:1。DNA与组蛋白是染色质的稳定成分,非组蛋白与RNA的含量则随细胞生理状态不同而变化。下面我们将对染色质DNA和染色质蛋白质进行详细叙述

    一、染色质DNA

    (一)基因组大小比较

    除部分病毒的遗传物质是RNA以外,凡是具有细胞形态的生物其遗传物质都是DNA。在真核细胞中,每条未复制的染色体包含一条纵向贯穿的DNA分子。

    狭义而言,某一生物的细胞中储存于单倍染色体组中的总遗传信息,组成该生物的基因组( genome)。真核生物基因组DNA的含量比原核生物高得多。大肠杆菌的基因组含46×10°bp,基因平均长度为1.2kb,基因数目约4288;而真核生物芽殖酵母基因组是大肠杆菌基因组的3~4倍,为12×107bp,基因平均长度为1.4kb,约有6000个基因;果蝇高达40倍(1.8×10°bp),基因平均长度为13kb,约有13600个基因;人的单倍体基因组几乎高达800倍,为32×10bp,基因平均长度为16.3kb,有30000-40000个基因(表9-2)。然而,突变分析结果表明,并非所有基因都是细胞生存的必需基因( essential gene),如酵母基因组有40%的基因属于非必需基因( nonessential gene);果蝇基因组只有5000个必需基因;最小最简单的细胞支原体(生殖支原体Mycoplasma genitalium),有迄今发现的能独立生活的有机体的最小基因组(470个基因),其中只有256个必需基因。

    (二)基因组DNA类型

    生物基因组DNA可以分为以下几类(以人类基因组为例):①蛋白编码序列,以三联体密码( triplet)方式进行编码。编码DNA在基因组中所占比例随物种而异(表9-2),在人类细胞基因组中,这一比例为1%-1.5%。这类编码序列主要是非重复的单一DNA序列,一般在基因组中只有一个拷贝(单一基因)。然而,也可能有两个或几个拷贝甚至多达上千个拷贝的情况,这些都来自于从基因家族里派生出来的重复基因( duplicated genes in gene families)或多基因( divergedgenes in gene families)。②编码TRNA、tRNA、 SnRNA

    和组蛋白的串联重复序列。它们在基因组中一般有20~300个拷贝,人类基因组中约含0.3%这样的DNA。③含有重复序列的DNA。这类DNA在基因组中占有很大一部分。它们又可分为两个亚类:简单序列DNA( simple sequence DNA)和散在重复( interspersed repeats)序列。DNA转座子、LTR反转座子、非LTR反转座子和假基因都属于散在重复序列。非LTR反转座子包括短散在元件( short interspersed element,SIE)和长散在元件( long interspersed element,LINE)。典型SINE长度少于500bp,如人和灵长类基因组中大量分散存在的Alu家族。人基因组中有50万-70万份Au拷贝,相当于平均每隔4kb就有一个Alu序列。典型LINE其长度为6-8kb,如人基因组中L1家族,有100000个L1拷贝。④未分类的间隔DNA( unclassified spacer DNA)(表9-3)。

    此外,真核细胞基因组中还含有高度重复DNA序列。每个基因组中至少含105个拷贝,约占脊椎动物总DNA的10%。高度重复DNA序列由一些短的DNA序

    列呈串联重复排列,可进一步分为几种不同类型:①卫星DNA( satellite DNA)。重复单位长5~100bp,不同物种重复单位碱基组成不同,一个物种也可能含有不同的卫星DNA序列。主要分布在染色体着丝粒部位,如人类染色体着丝粒区的a-卫星DNA家族,其功能不明。②小卫星DNA( minisatellite DNA)。重复单位长12~100bp,重复3000次之多,又称数量可变的串联重复序列。每个小卫星区重复序列的拷贝数是高度可变的,因此早前常用于DNA指纹技术( DNA finger-printing)做个体鉴定。研究发现小卫星序列的改变可以影响邻近基因的表达,基因的异常表达会导致一系列不良后果③微卫星DNA( microsatellite DNA)。重复单位序列最短,只有1~5bp,串联成簇长度50-100bp。人类基因组中至少有30000个不同的微卫星位点,具高度多态性( polymorphism),在不同个体间有明显差别,但在遗传上却是高度保守的,因此可作为重要的遗传标记,用于构建遗传图谱( genetic map)及个体鉴定等。

    生物的遗传信息储存在DNA的核苷酸序列中,生物界物种的多样性也寓于DNA分子4种核苷酸千变万化的排列之中。DNA分子不仅一级结构具有多样性,而且二级结构也具有多态性。所谓二级结构是指两条多核苷酸链反向平行盘绕所生成的双螺旋结构。DNA二级结构构型分三种:B型DNA(右手双螺旋DNA)是经典的“沃森-克里克”结构,二级结构相对稳定,水溶液和细胞内天然DNA大多为B型DNA;A型DNA是B型DNA的重要变构形式,同样是右手双螺旋DNA,其分子形状与RNA的双链区和 DNA/RNA杂交分子很相近;第三种是Z型DNA,呈左手螺旋,也是B型DNA的变构形式。

    三种构型DNA中,大沟的特征在遗传信息表达过程中起关键作用。基因表达调控蛋白都是通过其分子上特定的氨基酸侧链与沟中碱基对两侧潜在的氢原子供体(=NH)或受体(O和N)形成氢键而识别DNA遗传信息的。由于大沟和小沟中这些氢原子供体和受体各异以及排列不同,所以大沟携带的信息要比小沟多。此外,沟的宽窄及深浅也直接影响碱基对的暴露程度,从而影响调控蛋白对DNA信息的识别。B型DNA是活性最高的DNA构型,变构后的A型DNA仍有较高活性,变构后的Z型DNA活性明显降低。人们推测,在生理状态下,由于细胞内各种化学修饰的影响和结合蛋白的作用有可能使三种构型的DNA处于一种动态转变之中。此外,DNA双螺旋能进一步扭曲盘绕形成特定的高级结构,正、负超螺旋是DNA高级结构的主要形式。

    DNA二级结构的变化与高级结构的变化是相互关联的,这种变化在DNA复制、修复、重组与转录中具有重要的生物学意义。

    二、染色质蛋白

    与染色质DNA结合的蛋白质负责DNA分子遗传信息的组织、复制和阅读。这些DNA结合蛋白包括两类:一类是组蛋白( histone),与DNA结合但没有序列特异性;另一类是非组蛋白( nonhistone),与特定DNA序列或组蛋白相结合。

    (一)组蛋白

    组蛋白是构成真核生物染色体的基本结构蛋白,富含带正电荷的Arg和Lys等碱性氨基酸,等电点一般在pH10.0以上,属碱性蛋白质,可以和酸性的DNA紧密结合,而且一般不要求特殊的核苷酸序列。用聚丙烯酰胺凝胶电泳可以区分5种不同的组蛋白:H1、H2A、H2B、H3和H4。几乎所有真核细胞都含有这5种组蛋白,而且含量丰富,每个细胞每种类型的组蛋白约有6×10个分子。表9-4列举了5种组蛋白的些特性。

    5种组蛋白在功能上分为两组:①核小体组蛋白( nucleosomal histone),包括H2A、H2B、H3和H4。

    这4种组蛋白有相互作用形成复合体的趋势,它们通过C端的疏水氨基酸(如Val,ne)互相结合,而N端带正电荷的氨基酸(Arg、Lys)则向四面伸出以便与DNA分子结合,从而帮助DNA卷曲形成核小体的稳定结构。这4种组蛋白没有种属及组织特异性,在演化上十分保守,特别是H3和H4是所有已知蛋白质中最为保守的。例如牛和豌豆的H4组蛋白的102个氨基酸残基中仅有2个不同,而它们的分歧时间已有3亿年的历史。从这种保守性可以看出,H3和H4的功能几乎涉及它们所有的氨基酸,任何位置上氨基酸残基的突变可能对细胞都是有害的。②H1组蛋白。其分子较大(215个氨基酸)。球形中心在演化上保守,而N端和C端两个“臂”的氨基酸变异较大,所以H1在演化上不如核小体组蛋白那么保守。在构成核小体时H1起连接作用,它赋予染色质以极性。H1有一定的种属和组织特异性。

    在哺乳类细胞中,组蛋白H约有6种密切相关的亚型,氨基酸序列稍有不同。在鱼类和鸟类的成熟红细胞中,Hl为HS取代。有的生物如芽殖酵母缺少H1。

    (二)非组蛋白

    与染色质组蛋白不同,非组蛋白主要是指与特异

    DNA序列相结合的蛋白质,所以又称序列特异性DNA结合蛋白( sequence specific DNA binding protein)。利用非组蛋白与特异DNA序列亲和的特点,通过凝胶延滞实验( gel retardation assay),可以在细胞抽提物中进行检测。首先制备一段带有放射性标记的已知特异序列的DNA,将要检测的细胞抽提物与标记DNA混合,进行凝胶电泳。未结合蛋白质的自由DNA在凝胶上迁移最快,而与蛋白质结合的DNA迁移慢,一般结合的蛋白质分子越大,DNA分子的延滞现象越明显,然后通过放射性自显影分析,即可发现一系列DNA带谱,每条带分别代表不同的DNA-蛋白质复合物。每条带相对应的结合蛋白随后再通过细胞抽提物组分分离方法被进一步分开。

    非组蛋白具有以下特性:

    (1)非组蛋白具有多样性不同组织细胞中非组蛋白的种类和数量都不相同,代谢周转快。包括多种参与核酸代谢与修饰的酶类如DNA聚合酶和RNA聚合酶、高速泳动族蛋白( high mobility group,HMP)、染色体支架蛋白、肌动蛋白和基因表达调控蛋白等。

    (2)识别DNA具有特异性能识别特异的DNA

    序列,识别信息来源于DNA核苷酸序列本身,识别位点存在于DNA双螺旋的大沟部分,识别与结合依靠氢键和离子键。在不同的基因组之间,这些非组蛋白所识别的DNA序列在演化上是保守的。这类序列特异性DNA结合蛋白具有一个共同特征,即形成与DNA结合的螺旋区并具有蛋白二聚化的能力。

    (3)具有功能多样性虽然与DNA特异序列结合的蛋白质在每个真核细胞中只有10000个分子左右约占细胞总蛋白的1/50000,但它们具有多方面的重要功能,包括基因表达的调控和染色质高级结构的形成。

    如帮助DNA分子折叠,以形成不同的结构域;协助启动DNA复制,控制基因转录,调节基因表达。

    三、核小体

    20世纪70年代以前,人们关于染色质结构的传统看法认为,染色质是组蛋白包裹在DNA外面形成的纤维状结构。直到1974年RD. Kornberg等人根据染色质的酶切和电镜观察,发现核小体( nucleosome)是染色质组装的基本结构单位,提出染色质结构的“串珠”模型,从而更新了人们关于染色质结构的传统观念。

    (一)核小体的发现

    (1)用温和的方法裂解细胞核,将染色质铺展在电镜铜网上,通过电镜观察,未经处理的染色质自然结构为30m的纤丝,经盐溶液处理后解聚的染色质呈现一系列核小体彼此连接的串珠状结构,串珠的直径为llnm(图9-8)。

    (2)用非特异性微球菌核酸酶( micrococcal nuclease)消化染色质时,经过蔗糖梯度离心及琼脂糖凝胶电泳分析,发现绝大多数DNA被降解成大约200bp的片段;如果部分酶解,则得到的片段是以200bp为单位的单体以及二体(400bp)、三体(600bp)等。蔗糖梯度离心得到的不同组分,在波长260m的吸收峰的大小和电镜下所见到的单体、二体和三体的核小体组成完全一致。如果用同样方法处理裸露的DNA,则产生随机大小的片段群体。从而提示染色体DNA除某些周期性位点之外均受到某种结构的保护,避免核酸酶的接近。

    (3)应用X射线衍射、中子散射和电镜三维重建技术,研究染色质结晶颗粒,发现核小体颗粒是直径为11nm、高6.0mm的扁圆柱体,具有二分对称性(dyad symmetry)。核心组蛋白的构成是先形成(H3)2-(H4)2四聚体,然后再与两个H2A-H2B异二聚体结合形成八聚体(图9-9)。

    (4)SV40微小染色体( minichromosome)分析。用SV40病毒感染细胞,病毒DNA进入细胞后,与宿主的组蛋白结合,形成串珠状微小染色体,电镜观察SV40DNA为环状,周长1500mm,约5.0kb。若200bp相当于一个核小体,则可形成25个核小体,实际观察到23个,与推断基本一致。如用0.25moL盐酸将SV40溶解,可在电镜下直接观察到组蛋白的聚合体。若除去组蛋白,则完全伸展的DNA长度恰好为5.0kb。

    (二)核小体的结构

    (1)每个核小体单位包括200bp左右的DNA超螺旋和一个组蛋白八聚体以及一分子的组蛋白H1(图9-10)。

    (2)组蛋白八聚体构成核小体的盘状核心颗粒,分子质量为100kDa,由4个异二聚体组成,包括两个H2A-H2B和两个H3-H4(3)146bp的DNA分子超螺旋盘绕组蛋白八聚体1.75圈。组蛋白H1在核心颗粒外结合额外20 bp dNa,锁住核小体DNA的进出端,起稳定核小体的作用。

    (4)两个相邻核小体之间以连接DNA( linker dna)相连,典型长度为60bp,不同物种变化值为0-80b不等(图9-10)。

    (5)组蛋白与DNA之间的相互作用主要是结构性的,基本不依赖于核苷酸的特异序列。正常情况下不与组蛋白结合的DNA(如噬菌体DNA或人工合成的DNA),当与从动植物中分离纯化的组蛋白共同孵育时,可以体外组装成核小体单位。

    (6)核小体沿DNA的定位受不同因素的影响。如非组蛋白与DNA特异性位点的结合,可影响邻近核小体的相位( positioning);DNA盘绕组蛋白核心的弯曲也是核小体相位的影响因素,因为富含AT的DNA片段优先存在于DNA双螺旋的小沟,而富含GC的DNA片段优先存在于DNA双螺旋的大沟,结果核小体倾向于形成富含AT和富含GC区的理想分布,从而通过核小体相位改变影响基因表达。

    四、染色质组装

    人的每个体细胞所含DNA约6×10bp,分布在46条染色体中,总长达2m,平均每条染色体DNA分子长约5cm。然而,细胞核直径只有5~8m,这就意味着从染色质DNA组装成染色体要压缩近万倍,相当于一个网球内包含有20km长的细线。

    (一)染色质组装的前期过程

    图9-11是关于DNA组装成染色质的整个过程的描述。①最开始是H3-H4四聚体(两个异二聚体)的结合,由CAF1( chromatin assembly factor1)介导与新合成的裸露的DNA结合。②然后是两个H2A-H2B异二聚体由NAP和NAP2( nucleosome assembly protei

    in)介导加入。为了形成一个核心颗粒,新合成的组蛋白被特异地修饰。组蛋白H4的Ls5和Lys12两个位点被乙酰化。③核小体最后的成熟需要ATP来创建一个规则的间距以及组蛋白的去乙酰化。ISWI( imitation switch)和 SWISNF( switch/sucrose nonfermentable)家族的蛋白质参与此过程的调节。连接组蛋白(H1)的结合伴随着核小体的折叠。④6个核小体组成一个螺旋或由其他的组装方式形成一个螺线管结构(下面将详细讨论)。

    ⑤进一步的折叠事件将使染色质在细胞核中最终形成确定的结构。在图的右侧列出了各个环节中相应的参与因子,这些因子对于促进整个组装过程的顺利进行发挥了重要的作用。

    这样一个高度压缩的结构极大地阻碍了像转录这样的细胞核活动的进行。为了解决这个问题,有两个家族的染色质修饰酶在染色质上作用,使染色质更接近于转录机器。第一个家族是通过在组蛋白尾部的共价修饰而发挥作用,这些修饰包括组蛋白的磷酸化、乙酰化和泛素化等,它们会影响以后与DNA或组蛋白相互作用因子的作用。第二个家族成员的主要特点是它们能够利用ATP水解时释放的能量来破坏核小体中的组蛋白-DNA接触(染色质结构与基因表达的关系将在下一节中详细叙述)。

    染色质组装的前期过程,即从裸露DNA组装成直径30m的螺线管已有直接的实验证据,并被绝大多数科学家认可。然而,染色质如何进一步组装成更高级结构,直至最终成染色体的过程尚不是非常清楚,目前主要有两种模型。

    (二)染色质组装的多级螺旋模型

    由DNA与组蛋白组装成核小体,在组蛋白H1的介导下核小体彼此连接形成直径约10m的核小体串珠结构,这是染色质组装的一级结构。不过在细胞中,染色质很少以这种伸展的串珠状形式存在。当细胞核经温和处理后,在电镜下往往会看到直径为30nm的染色质纤维。在有组蛋白H1存在的情况下,由直径10nm的核小体串珠结构螺旋盘绕,每圈6个核小体,形成外径25-30mm,螺距12m的螺线管( solenoid)。组蛋白H1对螺线管的稳定起着重要作用。螺线管是染色质组装的二级结构(图9-12

    A.L.Bak等(1977)从人胎儿离体培养的分裂细胞中分离出染色体,经温和处理后,在电镜下看到直径0.4m,长11-60m的染色线,称为单位线(unit fiber)。在电镜下观察,判明单位线是由螺线管进一步螺旋化形成直径为0.4um的圆筒状结构,称为超螺线管( supersolenoid),这是染色质组装的三级结构。这种超螺线管进一步螺旋折叠,形成长2-10μm的染色单体,即染色质组装的四级结构。根据多级螺旋模型( multiple coiling model),从DNA到染色体经过四级组装:DNA、压缩7倍

    核小体压缩6倍

    螺线管 压缩40倍 超螺线管 压缩5倍 >染色单体

    经过四级螺旋组装形成的染色体结构,共压缩了8400倍。

    (三)染色质组装的放射环结构模型

    U.K. Laemmli等人用2mo的NaCl或硫酸葡

    聚糖加肝素处理HeLa细胞中期染色体,除去组蛋白和大部分非组蛋白后,在电镜下可观察到由非组蛋白构成的染色体骨架( chromosomal scaffold)和与骨架相连的无数的DNA侧环。此外,实验观察发现,一些特殊染色体,如两栖类卵母细胞的灯刷染色体或昆虫细胞的多线染色体,几乎都含有类似的袢环结构域(1oop domain),从而提示袢环结构可能是染色体高级结构的普遍特征(表9-5)。

    关于染色体骨架和染色质袢环的研究,使染色体袢环结构模型近年来引起人们的重视。该模型认为,30nm的染色线折叠成环,沿染色体纵轴,由中央向四周伸出,构成放射环,即染色体的骨架-放射环结构模型( scaffold radial loop structure model)。J. Painta和D.Coffey(1984)对该模型进行了较详细的描述:首先是直径2nm的双螺旋DNA与组蛋白八聚体构建成连续重复的核小体串珠结构,其直径10m。然后按每圈6个核小体为单位盘绕成直径30nm的螺线管。由螺线管形成DNA复制环,每18个复制环呈放射状平面排列,结合在核基质上形成微带( miniband)。微带是染色体高级结构的单位,大约10个微带沿纵轴构建成子染色体。

    上述两种关于染色体高级结构的组织模型,前者强调螺旋化,后者强调环化与折叠。两者都有一些实验与观察的证据,也许在不同的组装阶段这些机制共同起作

    用。图9-13是融两种机制在内的染色质组装模型。

    五、染色质类型

    间期染色质按其形态特征、活性状态和染色性能区分为两种类型:常染色质( euchromatin)和异染色质( heterochromatin)。

    (-)常染色质与异染色质

    常染色质是指间期细胞核内染色质纤维折叠压缩程度低,相对处于伸展状态,用碱性染料染色时着色浅的那些染色质。在常染色质中,DNA组装比为1/2000-11000,DNA实际长度为染色质纤维长度的1000-2000倍。

    构成常染色质的DNA主要是单一序列DNA和中度重复序列DNA(如组蛋白基因和RNA基因)。常染色质并非所有基因都具有转录活性,处于常染色质状态只是基因转录的必要条件,而不是充分条件。

    异染色质是指间期细胞核中染色质纤维折叠压缩程度高,处于聚缩状态,用碱性染料染色时着色深的那些染色质。异染色质又分结构异染色质或组成型异染色质( constitutive heterochromatin)和兼性异染色质( facultative heterochromatin)。结构异染色质指的是各种类型的细胞中,在整个细胞周期均处于聚缩状态,没有较大变化的异染色质。在间期核中,结构异染色质聚集形成多个染色中心( chromocenter)。在哺乳类细胞中,

    这些染色中心随细胞类型和发育阶段不同而变化。结构异染色质有如下特征:①在中期染色体上多定位于着丝粒区、端粒、次缢痕及染色体臂的某些节段。②由相对简单、高度重复的DNA序列构成,如卫星DNA

    ③具有显著的遗传惰性,不转录也不编码蛋白质。

    ④在复制行为上与常染色质相比表现为晚复制、早聚缩。⑤占有较大部分核DNA,在功能上参与染色质高级结构的形成,导致染色质区间性,作为核DNA的转座元件,引起遗传变异。兼性异染色质是指在某些细胞类型或一定的发育阶段,原来的常染色质聚缩,并丧失基因转录活性,变为异染色质。这类兼性异染色质的总量随不同细胞类型而变化,一般胚胎细胞含量很少,而高度特化的细胞含量较多,说明随着细胞分化,较多的基因渐次以聚缩状态而关闭,从而再也不能接近基因活化蛋白。因此,染色质通过紧密折叠压缩可能是关闭基因活性的一种途径。例如雄性哺乳类细胞的单个X染色体呈常染色质状态;而雌性哺乳类体细胞的核内,两条X染色体之一在发育早期随机发生异染色质化而失活。

    在上皮细胞核内,这个异固缩的X染色体称性染色质或巴氏小体( Barr body)。因此,检查羊水中胚胎细胞的巴氏小体可以预报胎儿的性别。在多形核白细胞的核内,此ⅹ染色体形成特殊的“鼓槌”结构

    (工)常染色质与异染色质间的转变

    有些染色质并不是固有的异染色质或常染色质,而是在异染色质或常染色质之间随着发育时期或细胞周期的变化而相互转化。异染色质与常染色质之间的转变常常需要伴随着一些组蛋白与DNA修饰。如图9-14所示,由常染色质转变成异染色质时,H3S10(组蛋白H3第十位丝氨酸)位上首先要被JIL磷酸酶去磷酸化同时HDAC1负责H3K9的去乙酰化,这样使得H3K9(组蛋白H3第九位赖氨酸)位点的甲基化(由Su(var)3-9负责)得以进行,而这是异染色质化的一个重要标志。除此之外,H3K4位点上的甲基则需要被LSD1去甲基化。H3K9甲基化使得异染色质蛋白HP1能够顺利与染色质结合,HP1的多聚化能够使得染色质进一步浓缩。在这一过程中,染色质组装因子CAF1也起着非常重要的调节作用。H3K9的甲基化也伴随着H3K27的甲基化和H4K20的甲基化。它们共同决定最终异染色质的形成。另一方面,由异染色质转变为常染色质的过程则伴随着基本上相反的组蛋白修饰过程DNA甲基化在决定染色质的异染色质化/常染色质化过程中也起着重要的调节作用。

    (三)活性染色质与非活性染色质

    按功能状态的不同可将染色质分为活性染色质( active chromatin)和非活性染色质( (inactive chromatin)。

    对绝大多数细胞而言,在特定阶段具有转录活性的基因只占基因总数的10%以下,而90%以上的基因在转录上是不活跃的。所谓活性染色质是指具有转录活性的染色质,非活性染色质是指没有转录活性的染色质。

    活性染色质由于核小体构型发生改变,往往具有疏松的染色质结构,从而便于转录调控因子与顺式调控元件结合和RNA聚合酶在转录模板上滑动。当染色质结构处于疏松状态时,利用核心组蛋白H3暴露出来的游离巯基与有机汞的亲和性,可采用有机汞亲和层析和二硫苏糖醇(DTT)洗脱的方法将活性染色质分离出来。

    1.活性染色质对 DNase超敏感

    当染色质用 DNase消化时,可将染色质降解成酸溶性的DNA小片段。若从鸡红细胞中提取染色质进行上述处理,发现β一珠蛋白基因很快就被降解,而卵清蛋白基因的降解程度则很低。相反,若从鸡输卵管细胞中提取染色质作同样处理,则优先降解的是卵清蛋白基因而不是β一珠蛋白基因。结果表明,凡有基因表达活性的染色质DNA对 DNase I的降解作用比没有转录活性的染色质DNA要敏感得多。进一步发现,正在转录或具有潜在转录活性而未转录的基因对 DNase I同样敏感,说明活化染色质对 DNase I的优先敏感性( preferential sensitivity)不是由于转录过程中RNA聚合酶的作用,而是可转录染色质的一个基本特征。用DNase I处理染色质时,优先释放出两种HMG非组蛋白,它们是HMG14和HMG17。当把这两种非组蛋白从鸡红细胞染色质中用低盐溶液抽提出来以后,珠蛋白基因就不再表现出对 DNase I的优先敏感性,而在盐抽提过的染色质中加入这两种非组蛋白后,敏感性又可恢复,说明活化染色质对 DNase I的优先敏感性与这两种非组蛋白有关。然而,把这两种蛋白质加入盐抽提过的鸡脑细胞染色质后,其中的珠蛋白基因并不表现出对 DNase I优先敏感性,说明这些HMG蛋白不是造成这种优先敏感性的唯一原因。红细胞和脑细胞中一定还存在其他因子的差异,这些因子决定了红细胞的珠蛋白基因在HMG14和HMG17存在时对DNase I敏感。

    如用很低浓度的 DNase I处理染色质,切割将首先发生在少数特异性位点上,这些特异性位点叫做DNase I超敏感位点( DNase I hypersensitive site)。超敏感位点的存在是活性染色质的特点,若用游离DNA作底物则无超敏感位点出现。通过对大量基因进行试验发现,每个活跃表达的基因都有一个或几个超敏感位点,大部分位于基因5端启动子区域,少部分位于其他部位如转录单位的下游。并且发现,5′端超敏感位点只出现在基因正在活跃表达的细胞中,而该基因不表达的细胞中则不存在。例如,对于鸡β-珠蛋白基因族,胚胎阶段超敏感位点出现在胚胎型基因而不是成体型基因的5′端;而在成体阶段情况则恰好相反,超敏感位点出现在成体型而不是胚胎型β-珠蛋白基因的5′端。这说明超敏感位点和基因活性有一定的关系。现已知道,超敏感位点实际上是一段长100~200bp的DNA序列特异暴露的染色质区域。由超敏感位点所引起的染色质结构变化,可能是由于超敏感序列首先与其他蛋白质结合而阻止核小体的组装。这样,该序列不被组蛋白八聚体所保护,所以一个典型的超敏感位点区对核酸酶攻击的敏感性是其他染色质区域的100倍以上。

    活性基因的超敏感位点建立在启动子附近,并与启动子功能有关,很可能是为RNA聚合酶、转录因子或其他蛋白调控因子提供结合位点。现有证据表明5端超敏感位点的建立发生在转录起始之前,但很可能是起始转录的必要条件而非充分条件。有人为说明超敏感位点的稳定性,用温度敏感的肿瘤病毒转化导致珠蛋白基因的激活,并建立超敏感位点;如果转化在非许可的较高温度下完成,则珠蛋白基因不被激活,也不出现超敏感位点;在低温下珠蛋白基因被转化激活后,若提高温度可使其失活而不表达,但已建立的超敏感位点却至少要保持到细胞复制20次以后。这一结果也证实了超敏感位点的建立只是起始转录所必要的特征之一,但建立超敏感位点的事件与保持该位点的事件可能是不同的。

    2.活性染色质的蛋白组成与修饰变化

    根据对活性染色质蛋白组分的生化分析发现:①活性染色质很少有组蛋白H1与其结合。②活性染色质的4种核心组蛋白虽然以常量存在,但是与非活性染色质相比较,活性染色质上的组蛋白乙酰化程度高。

    ③活性染色质的核小体组蛋白H2B与非活性染色质相比较,很少被磷酸化。④核小体组蛋白H2A在许多物种包括果蝇和人的活性染色质中很少有变异的形式存在。③最新研究表明,组蛋白H3的变种H3.3只在活跃转录的染色质中出现。⑥HMG蛋白是染色体非组蛋白中一组较丰富、不均富含电荷的蛋白质。其中HMG14和HMG17只存在于活性染色质中,与DNA结合。平均每10个核小体中有1个核小体是与HMG14和HMG17结合的,其氨基酸序列在演化中高度保守表明其具有重要功能。

    许多研究工作已经清楚地表明,一些组蛋白的修饰直接影响染色质的活性。这些修饰包括甲基化、乙酰化和磷酸化。乙酰化一般是活性染色质的标志(下面会详细叙述),而甲基化和磷酸化则在活性染色质与非活性染色质中都存在。不同组蛋白或同一组蛋白的不同氨基酸残基上的修饰决定染色质处于活性或非活性状态。

    图9-15举例说明了H3组蛋白的修饰与染色质活性的关系。活性染色质的标志是:H3的N端第4个赖氨酸甲基化,第9和14个赖氨酸乙酰化以及第10个丝氨酸磷酸化。非活性染色质的标志是:H3的N端第9个赖氨酸甲基化而不是乙酰化。此外,其他蛋白修饰如泛素化修饰也可在组蛋白上发生,如H2A119位赖氨酸和H2B120位赖氨酸都可被泛素化修饰,然而这些修饰与染色质活性的关系目前还不是非常清楚。