动态且独特的组蛋白修饰促进人类滋养层谱系分化

H3K4me3 的景观在 TSC 分化过程中经历动态变化

为了在滋养层谱系分化过程中获得 H3K4me3、H3K27me3、H3K27ac 和 H3K9me3 跨基因组的全面概况,我们使用 ChIP-seq 在 TSC、中期和完全分化的 ST(TSC 分化为ST 6 天)和 EVT(TSC 分化为 EVT 8 天)。 使用 MAnorm 比较 TSC 和 ST 之间的 H3K4me3 基因座后26,我们将 H3K4me3 位点分为三个不同的簇:S1(富含 TSC)、S2(常见)和 S3(富含 ST)簇(图 1)。 1A,补充图。 1A、补充表 1)。 虽然大部分 H3K4me3 基因座 (S2) 在 ST 形成过程中保持其 H3K4me3 信号不变,但富含 TSC 的簇 (S1) 即使在 ST 形成的中期(分化第 3 天)也表现出 H3K4me3 水平的显着降低(图。A 1A 和 B)。 这意味着富含 TSC 的簇 (S1) 处的 H3K4me3 信号丢失先于 ST 形成的成熟。 相比之下,富含 ST 的簇 (S3) 中的 H3K4me3 在分化时出现(图 1)。 1A 和 B)。 与这些发现一致的是,富含 TSC 的簇 (S1) 中的基因在 ST 形成时表现出表达减少。 该簇中值得注意的基因包括 TEAD4 和 TP63,它们是 TSC 活性基因(补充图 1)。 1B)。 另一方面,ST 富集簇 (S3) 中的基因,包括 TBX3 和 GCM1,它们是 ST 活性基因(补充图 1)。 1B),在 ST 形成过程中表现出表达增加(图 2) 1C)。 正如预期的那样,公共簇 (S2) 中的基因没有表现出实质性的表达变化。 对每个簇中基因的基因本体 (GO) 分析表明,与 TSC 维持相关的 GO 术语,例如上皮细胞增殖和细胞-细胞连接组装,在 TSC 富集的簇 (S1) 中过多,而 GO 术语与 TSC 维持相关。 ST 功能,包括激素代谢过程和女性怀孕,在 ST 富集簇(S3)中高度富集(图 1)。 1D)。

图1

H3K4me3 的模式在 TSC 分化过程中经历动态变化。 (A) 热图显示了 TSC 分化为 ST 期间 H3K4me3 信号在三个分类组(S1:TSC 富集、S2:普通和 S3:ST 富集)内的分布。 PC表示峰中心。 (B) 线图显示 TSC、ST d3(第 3 天 TSC 分化为 ST)和 ST 的每个类别内峰值中心附近的 H3K4me3 信号强度。 (C) 箱线图显示 ST d3 和 ST 中各类别基因相对于 TSC 的表达水平。 (D) 与 TSC 富集和 ST 富集类别内的基因生物过程相关的基因本体 (GO) 术语的富集。 (E) 热图显示了 TSC 分化为 EVT 期间 H3K4me3 信号在三个分类组(E1:富含 TSC、E2:普通和 E3:富含 EVT)内的分布。 PC表示峰中心。 (F) 线图显示 TSC、EVT d3(第 3 天 TSC 分化为 EVT)和 EVT 的每个类别内峰值中心周围 H3K4me3 的信号强度。 (G) 箱线图显示了 EVT d3 中每一类的基因以及 EVT 相对于 TSC 的表达水平。 (H) 丰富了 TSC 富集和 EVT 富集类别内基因的生物过程 GO 术语。

此外,通过比较 TSC 和 EVT 之间的 H3K4me3 位点,我们将 H3K4me3 位点分为三个不同的簇(E1、E2 和 E3)(图 1)。 1E,补充图。 1C、补充表 2)。 与 ST 形成类似,大多数 H3K4me3 位点 (E2) 在 EVT 形成过程中基本保持不变(图 1)。 1E 和 F)。 值得注意的是,即使 EVT 特异性 H3K4me3 特征出现,处于 EVT 形成中期(分化第 3 天)的细胞仍显着保留富含 TSC 的 H3K4me3 信号 (E1),但这种富含 TSC 的 H3K4me3 特征在完全分化的 EVT 中减弱。 相反,EVT 富集的 H3K4me3 位点 (E3) 在 EVT 形成三天后获得 H3K4me3 信号(图 1)。 1E 和 F)。 与此一致的是,富含 TSC 的簇 (E1) 中的基因表现出表达减少,而富含 EVT 的簇 (E3) 中的基因,例如 EVT 活性 ASCL2 和 MMP2,(补充图 1) 1D),在 EVT 形成过程中表现出表达增加(图 1) 1G)。 GO 分析发现,EVT 富集簇 (S3) 中的这些基因表现出 GO 术语的过度表达,例如胎盘发育、细胞对激素刺激的反应以及免疫反应的调节,所有这些都与胎盘发育相关(图 1)。 1H)。

总的来说,这些发现表明,H3K4me3 景观在 TSC 分化为 ST 和 EVT 的过程中动态地重新配置,为滋养层谱系分化创造了有利的表观遗传环境。 这一见解揭示了与滋养层谱系分化相关的表观遗传变化以及胎盘发育过程中细胞身份的建立。

广泛的 H3K4me3 结构域决定滋养层细胞类型特异性基因表达

虽然大多数 H3K4me3 峰通常是尖锐和狭窄的,但之前的研究表明,H3K4me3 特征也可以广泛传播到基因子集上,跨度长达 60 kb 进入其基因体11,27。 H3K4me3 的这些广泛结构域与增强的转录延伸、染色质相互作用以及细胞身份和功能的调节相关11,13,28。 为了研究这种宽域介导的细胞类型特异性基因调控在人类滋养层谱系中是否保守,我们首先使用具有宽峰调用选项的 MACS3 鉴定了 TSC、ST、EVT 和 ESC 中含有宽 H3K4me3 域的基因29。 随后,H3K4me3 峰根据其宽度进行排名。 如图所示 2A和补充图。 2A,我们在基因 TSS 附近观察到各种宽度的峰。 大多数峰的宽度小于 3 kb,无论滋养层谱系如何,平均值为 1.6 kb(图 1)。 2B和补充图。 2B)。 H3K4me3 峰的宽度与基因活性呈正相关(图 1)。 2C和补充图。 2C)。 我们还观察到,广泛的 H3K4me3 信号在众所周知的滋养层谱系特异性基因(包括 TSC 的 TEAD4)的启动子附近显着富集30TBX3 用于 ST31,以及用于 EVT 的 ASCL232 (图. 2D),表明广泛的 H3K4me3 结构域调节滋养层谱系特异性基因表达。 为了进一步研究广泛的 H3K4me3 结构域是否可以决定细胞类型特异性基因表达,我们比较了 TSC 和 ESC 之间 H3K4me3 的宽度。 如图所示 2E和F,对于先前报道的关键TSC TF(例如GATA2、TEAD4和TP63),TSC表现出更广泛的H3K4me3结构域,而ESC对于核心ESC特异性TF(例如POU5F1、SOX2和NANOG)具有更大的H3K4me3结构域。 这些结果表明,广泛的 H3K4me3 结构域在控制滋养层谱系中细胞类型特异性基因表达方面发挥着关键作用。

图2

广泛的 H3K4me3 结构域决定了滋养层细胞类型特有的基因的表达。 (A) 热图描绘了 H3K4me3 信号在 TSC 和 ESC 中的分布。 TSS 表示转录起始位点。 (B) 分布 H3K4me3 峰按其在 TSC 中的宽度排列。 红色虚线表示峰宽度的平均值。 (C) 点图说明 H3K4me3 峰的宽度与 TSC 中与 H3K4me3 相关的基因表达之间的相关性。 R表示皮尔逊相关系数。 P 值通过 t 检验计算。 红线表示回归线。 (D) TEAD4、TBX3 和 ASCL2 附近的 TSC、ST 和 EVT 的 H3K4me3 ChIP-seq 轨迹。 (E) 热图显示与 ESC 相比,TSC 中 H3K4me3 跨基因的相对宽度。 代表细胞类型的 TF 显示在热图旁边。 括号中的数字表示基因的等级。 (F) H3K4me3 ChIP-seq 跟踪 TP63、GATA2、SOX4 和 ZIC2 周围的 ESC 和 TSC。 (G) 条形图显示了 TSC 中广泛的 H3K4me3 结构域相关基因的富集分析中富集的组织和细胞类型。 (H) 条形图显示了与 TSC 中广泛的 H3K4me3 结构域相关的基因中丰富的生物过程 GO 术语。

考虑到广泛的 H3K4me3 结构域与细胞类型特异性基因表达的关联,我们试图识别滋养层谱系特异性因子。 首先,我们根据域的宽度对 H3K4me3 相关基因进行排序,并在中鉴定出 839、751 和 1034 个广泛的 H3K4me3 域相关基因,其截止标准为前 5%(宽度≥4 kb)。分别为 TSC、ST 和 EVT(补充表 3)。 这些基因的表达在胎盘组织中过多(图 1)。 2G和补充图。 2D)。 对 TSC、ST 和 EVT 中广泛域相关基因的 GO 分析表明,胎盘发育的 GO 术语在所有三个滋养层谱系中均丰富(图 1)。 2H和补充图。 2E)。 此外,每个谱系都显示出丰富的谱系特定功能的 GO 术语,例如 ST 中对激素的反应和 EVT 中的血管发育。 在广泛的 H3K4me3 结构域相关基因中,我们在 TSC、ST 和 EVT 中分别鉴定了 139、139 和 184 个转录因子 (TF)(补充表 3)。 这些 TF 包括几乎所有先前报道的人类滋养层调节因子,包括 GATA233,GATA334GCM135ASCL232,MSX236TBX331EP30037ELF338,BHLHE4039HIF1a40TEAD430扭转41 以及人类滋养层中许多未表征的转录因子。 这些发现表明,广泛的 H3K4me3 可以作为识别新型滋养层谱系特异性 TF 的有价值的工具。

TSC 不像 ESC 那样具有坚固的二价结构域

在 ESC 中,二价结构域充当保持发育基因平衡的机制,抑制其表达,直到收到分化线索14。 根据人类 ESC 中 H3K4me3 和 H3K27me3 特征的存在,先前的研究将基因分为 4 组:G1(仅 H3K4me3)、G2(二价)、G3(仅 H3K27me3)和 G4(无标记)42。 尽管之前的研究报告称二价结构域在小鼠 TSC 中并不常见43,它们尚未在人类 CT 和 TSC 中进行彻底研究。 为了确定 CT 和 TSC 是否表现出与 ESC 相似的二价结构域特征,我们将 H3K4me3 和 H3K27me3 的所有 ChIP-seq 读数映射到这四个不同基因组的 TSS。 正如预期的那样,ESC 在 G2 基因上显示出 H3K4me3 和 H3K27me3 的强大特征(图 1)。 3A、B 和补充图。 3A,B),其中包括一些滋养层活性基因,例如 KRT7、GATA3 和 MSX2(图 1) 3C)。 这表明滋养层活性基因的子集受到 ESC 中二价结构域的抑制。 然而,与 ESC 不同,TSC 和 CT 在 G2 基因中具有中等强度的 H3K4me3,但非常弱的 H3K27me3(图 1)。 3A、B 和补充图。 3C,D),表明大多数 G2 基因不受 CT 和 TSC 中二价结构域的调控。 一致的是,G2 中的基因表现出比 G3 和 G4 中更高的表达,G3 和 G4 缺乏 H3K4me3 标记,但表达显着低于 G1 中的基因,G1 中在 TSC 中观察到更强的 H3K4me3 信号(图 1)。 3D)。 此外,TSC 中强烈表达的 G2 基因在胎盘中也高表达(图 1)。 3E)。 与 CT 和 TSC 一样,我们没有在 EVT 或 ST 中检测到稳健的二价特征(补充图 1)。 3E-H)。

图3

虽然 TSC 和 CT 缺乏二价特征,但广泛增加的 H3K4me3 信号在 TSC 分化过程中激活 ST 活性和 EVT 活性基因。 (A) 热图显示了先前分类的 4 组中 H1 ESC (GSE135696)、TSC 和 CT (GSE127288) 的 H3K4me3 和 H3K27me3 信号分布(G1:仅 H3K4me3,G2:二价,G3:仅 H3K27me3,G4:人类 ESC 中无标记)42。 (B) 线图显示属于每组基因的 TSS 周围的 ESC、TSC 和 CT 的 H3K4me3 和 H3K27me3 的信号强度。 (C) KRT7、GATA3 和 MSX2 周围 ESC 和 TSC 的 H3K4me3 和 H3K27me3 的 ChIP-seq 轨迹。 (D) 箱线图显示 TSC 中各个组相关基因的表达分布。 (E) 条形图显示通过 TSC 中 G2 基因的富集分析富集的组织和细胞类型。 (F) 和 (G) 热图描绘了 TSC 中 H3K4me3、H3K27me3 和 H3K9me3 信号的分布。 TSS 按 H3K4me3 信号排序,然后 H3K27me3 和 H3K9me3 信号并排对齐 (F)。 TSS按照H3K27me3信号进行排序,然后H3K4me3和H3K9me3信号并列在(G)旁边。 (H) 热图显示了 ST 活性基因 TSS 周围 TSC、CT 和 ST 的 H3K4me3 和 H3K27me3 信号分布。 (I) 线图显示 ST 活性基因 TSS 周围的 TSC、CT 和 ST 中 H3K4me3 和 H3K27me3 的信号强度。 (J) 热图描绘了 EVT 活性基因 TSS 周围 TSC、CT 和 EVT 的 H3K4me3 和 H3K27me3 信号分布。 (K) 线图显示 EVT 活性基因 TSS 周围的 TSC、CT 和 EVT 中 H3K4me3 和 H3K27me3 的信号强度。

TSC 中抑制性组蛋白标记 H3K27me3 和 H3K9me3 与 H3K4me3 呈反比关系

我们还研究了 H3K4me3、H3K27me3 和 H3K9me3 标记之间的空间关系。 最初,我们对 H3K4me3 信号进行了排名,并将 H3K27me3 和 H3K9me3 签名与它们并列在一起(图 1)。 3F)。 一般来说,H3K4me3 的活性组蛋白标记与 H3K27me3 和 H3K9me3 的抑制性组蛋白标记呈负相关。 当我们首先对 H3K27me3 信号进行排序并将 H3K4me3 信号与 H3K27me3 标记相邻时,这种逆相关模式变得更加明显(图 1)。 3G)。 这种模式在 CT 中得到了一致的观察(补充图 1)。 3L)。 这些发现表明,活性组蛋白标记和抑制性组蛋白标记在自我更新的滋养层中明显分离。

H3K4me3 信号向基因体的广泛升高触发 TSC 分化过程中 ST 活性和 EVT 活性基因的表达

ST 活性和 EVT 活性基因必须在 TSC 中受到抑制,直到分化信号开启。 在ESC中,发育基因由二价结构域控制。 然而,我们没有在 CT 和 TSC 中观察到强大的二价结构域,这表明它们通过与 ESC 等二价结构域不同的机制来抑制 ST 活性和 EVT 活性基因。 为了确认 ST 活性和 EVT 活性基因是否由 CT 和 TSC 中的二价结构域控制,我们评估了其中 ST 活性和 EVT 活性基因启动子附近是否存在 H3K4me3 和 H3K27me3 信号。 我们根据相对于 TSC 的表达水平定义了 ST 活性和 EVT 活性基因,选择标准为至少高四倍的表达和调整后的 P 值≤0.01(补充图 1) 3I-K 和补充表 4)。 如图所示 3H-K,我们没有在 CT 和 TSC 中 ST 活性和 EVT 活性基因的启动子处观察到二价结构域特征,证实二价结构域不负责 CT 中 ST 活性和 EVT 活性基因的失活和 TSC。 有趣的是,虽然 ST 活性和 EVT 活性基因上的 H3K27me3 信号在 TSC 分化为 ST 和 EVT 的过程中基本保持不变,但弱而窄的 H3K4me3 信号转化为广泛而强的信号,与 ST 活性和 EVT 活性基因的激活一致。 这些发现表明,ST 活性和 EVT 活性基因在 TSC 中受到表观遗传抑制,原因是 H3K4me3 信号不足,而不是二价结构域的存在。

TSC 特异性增强子在 TSC 分化为 ST 的早期阶段失活

H3K27ac被认定为活性增强子标记16,44。 为了研究 TSC 分化为 ST 或 EVT 过程中增强子的差异使用,我们绘制了 H3K27ac 的组蛋白修饰图。 与 H3K4me3 分析类似,通过比较 TSC 和 ST 之间的 H3K27ac 信号,我们将 H3K27ac 位点分为三组:SC1(TSC 丰富)、SC2(常见)和 SC3(ST 丰富)(图 1)。 4A,补充图。 4A、补充表 5)。 大多数 H3K27ac 信号在整个分化过程中保持稳定。 有趣的是,TSC 特异性增强子 (SC1) 在 TSC 分化为 ST 的早期阶段(第 1 天)经历失活,而 ST 特异性增强子 (SC3) 尚未变得活跃(图 1)。 4A 和 B)。 这一观察结果表明,在激活 ST 特异性增强子之前,停用 TSC 特异性增强子。 这种表观遗传重置为 TSC 分化为 ST 提供了有利的环境。 我们还比较了 EVT 和 TSC 之间的 H3K27ac 位点,随后将它们分为三组:EC1(富含 TSC)、EC2(常见)和 EC3(富含 ST)。 (图. 4C,补充图。 4B、补充表 6)。 与 ST 形成期间观察到的模式相反,TSC 增强子在 EVT 形成的中期仍然活跃,而 EVT 特异性增强子(EC3)开始出现(图 1)。 4C 和 D)。 基因本体分析揭示,TSC增强子调控的基因与管形态发生、细胞形态发生和细胞连接组织等生物过程相关,而ST增强子调控的基因在金属离子转运、分泌和激素反应等GO方面富集(补充图 4C)。 EVT增强子调节的基因表现出细胞形态发生和细胞投射组织调节的富集,这可能在EVT形态发生和侵袭中发挥作用(补充图1) 4D)。

图4

增强子在 TSC 分化为 ST 和 EVT 的过程中经历动态变化。 (A) 热图显示了 TSC 分化为 ST 期间 H3K27ac 信号在三类组(SC1:TSC 富集、SC2:普通和 SC3:ST 富集)中的分布。 PC表示峰中心。 (B) 线图显示每组内 TSC、ST d1(第 1 天 TSC 分化为 ST)和 ST 的峰值中心附近的 H3K27ac 信号强度。 (C) 热图描绘了 TSC 分化为 EVT 期间 H3K27ac 信号在三类组(EC1:富含 TSC、EC2:普通和 EC3:富含 EVT)中的分布。 PC表示峰中心。 (D) 线图显示每组内 TSC、EVT d3(第 3 天 TSC 分化为 EVT)和 EVT 的峰值中心周围 H3K27ac 的信号强度。 (E) 热图说明了 7 个分类组(E1、E2、E3、E4、E5、E6 和 E7)中 TSC、ST 和 EVT 的 H3K27ac 信号分布。 PC表示峰中心。 (F) 线图显示 TSC、ST 和 EVT 中 E1、E2 和 E3 簇的峰中心周围的 H3K27ac 信号强度。 (G) 条形图呈现与 E1、E2 和 E3 增强子相关的基因的生物过程的丰富 GO 术语。 (H)维恩图,说明 TSC 中 SE 相关基因和广泛的 H3K4me3 结构域相关基因之间的重叠。 (I) 箱线图,显示 TSC 中 SE 相关基因 (G1)、广泛 H3K4me3 域相关基因 (G2) 以及 SE 和广泛 H3K4me3 域相关基因 (G3) 的表达水平。

此外,为了分离 TSC、ST 和 EVT 之间的滋养层谱系特异性增强子,我们比较了它们的 H3K27ac 位点。 如图所示 4E 和 F,我们可以分离 7 个 H3K27ac 位点簇(补充表 7)。 每种滋养层细胞类型都拥有独特的增强子(E1、E2 和 E3),两种滋养层类型(E4、E5 和 E6)之间共享的增强子,以及所有三个滋养层谱系(E7)之间共享的增强子。 GO 分析表明,每个滋养层谱系特异性增强子都与各自滋养层谱系特有的功能相关(图 1)。 4G)。 例如,与富含 ST 的增强子相关的基因在促性腺激素分泌和肽激素加工的调节中被过度表达,这是 ST 的主要功能之一45。 与富含 TSC 的增强子相关的基因在胎盘发育和河马信号通路的 GO 方面表现出显着的富集。 与富含 EVT 的增强子相关的基因在胎盘发育和上皮间质转化 (EMT) 的正向调节中被过度表达,这对于 EVT 的形成和侵袭至关重要46。 总之,我们的研究结果表明,滋养层谱系特异性增强子通过调节谱系特异性基因的表达,在协调滋养层谱系分化中发挥着关键作用。

与 SE 和广泛的 H3K4me3 结构域相关的基因具有强大的基因表达

超级增强子 (SE) 是位于附近的增强子簇,驱动对于定义细胞身份和功能至关重要的基因表达。 鉴于 SE 和广泛的 H3K4me3 标记都已知可驱动细胞类型特异性基因表达,我们试图了解它们对基因表达的影响。

为了探索广泛的 H3K4me3 结构域和超级增强子对基因表达的影响,我们通过使用 ROSE 程序分析 H3K27ac 的 ChIP-seq 数据,鉴定了 TSC、ST 和 EVT 中的 SE19 (补充表 8)。 随后,根据它们与 SE 和广泛 H3K4me3 结构域的关联,我们将基因分为三组:G1:仅 SE,G2:仅广泛 H3K4me3,G3:SE 和广泛 H3K4me3(图 1) 4H和补充图。 4E、F)。 TSC、ST 和 EVT 中分别大约 19%、20% 和 28% 的 SE 相关基因在其启动子处也具有广泛的 H3K4me3 结构域。 值得注意的是,这些基因在不同滋养层细胞类型的组中表现出最高水平的表达(图1)。 4I 和补充图。 4G、H)。

1708765514
2024-02-24 08:21:19
#动态且独特的组蛋白修饰促进人类滋养层谱系分化

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​