细胞类型特异性非cpg甲基化的计算机meta分析

如今,全基因组分析所需的原始数据量非常大,即使是原始作者也很难花足够的时间进行彻底的分析。此外,对于这样的“大数据”,执行元分析(即对来自不同来源的综合数据进行分析)实际上会更加困难。因此,在原始数据存储库的森林中似乎仍然有许多隐藏的宝藏。在这里,我们在我们最近的研究中报告这样一个例子。

图1所示。DNMTs对mCpHpH和mCpHpG的不同贡献导致mcph在ESC和神经元中的分布和功能不同。

为了理解基因表达是如何调控的,重要的是要了解表观遗传信息,即不直接编码在基因组序列中的信息,是如何参与整个机制的。几种类型的表观遗传信息是已知的:DNA甲基化,组蛋白尾部的各种修饰,以及各种类型的染色质结构,如TAD(拓扑相关结构域)结构。其中,DNA甲基化通常发生在CG二核苷酸中的胞嘧啶核苷酸上,通常表示为CpG。众所周知,广泛甲基化的DNA区域是转录不活跃的,这些区域可以通过几种技术在全基因组范围内检测到,例如全基因组亚硫酸盐测序(WGBS)。因此,许多不同细胞类型和/或发育阶段的WGBS数据已经产生并存储在公共数据库中。

有趣的是,我们也知道DNA的甲基化并不只发生在CpG环境中;这种(特殊的)非cpg型甲基化称为CpH甲基化,因为H在IUPAC代码中表示A、T或C。重要的是,在有限的细胞类型中观察到CpH甲基化,如胚胎干细胞(ESCs)和神经元。虽然我们知道引起CpH甲基化的酶也会引起CpG甲基化,但一些证据表明CpH甲基化本身起着一些特定的作用。然而,它们的具体机制和作用仍不清楚。

通过结合几种细胞类型的WGBS数据及其相关数据,如这些细胞类型的转录组数据,我们对(胚胎)干细胞和神经元中的CpH甲基化进行了相当全面的meta分析。然后,我们发现ESCs和神经元之间CpH甲基化的性质有很大不同:在ESCs中,甲基化酶DNA甲基转移酶3b (DNMT3b)优先转录,它主要在CAG环境中起作用,而另一种酶DNMT3a在神经元中转录更多,更倾向于CAC环境。此外,在神经元中,甲基化的CACs被脑疾病相关蛋白(如MeCP2)识别,而在esc中,DNMT3b与组蛋白标记H3K36me3相互作用,H3K36me3在活性转录基因中普遍存在。我们的发现将有助于更详细地了解CpH甲基化的细胞作用,并强调对公开可用数据进行进一步广泛的荟萃分析的重要性。

李钟勋,朴成俊,中井健太
日本东京大学医学研究所

出版

DNMT3s引起的胚胎干细胞和神经元非cpg甲基化的差异景观。
李建辉,朴世杰,Nakai K
2017年9月12日

脸谱网 推特 linkedin 邮件 脸谱网 推特 linkedin 邮件

留言回复