近些年来,表观遗传技术之一高通量染色体构象捕获技术(Hi-C)得到了广泛应用,随着相关高水平文章的不断发表和科服市场的长期推广,Hi-C被众所周知。在后基因组时代,通过Hi-C研究基因组空间结构,解析基因与调控元件之间的互作从而阐明基因表达变化的调控机制,已势在必行,众多科研人员也纷纷加入研究3D基因组的时代浪潮中。然而Hi-C技术本身并非一成不变,它其实经历了不同版本的迭代升级,我们简要回顾如下。
01
2009年,美国马萨诸塞大学医学院Job Dekker团队在Science上发表了高通量染色体构象捕获技术(Hi-C),当时Erez Lieberman-Aiden与Nynke L. van Berkum为共同第一作者,Job Dekker和Eric S. Lander为共同通讯作者。此版本Hi-C使用的限制性内切酶是六碱基的HindIII,整体实验反应体系较大,也被称作dilution Hi-C,可以认为是Hi-C 1.0版本。
02
2014年,Erez Lieberman-Aiden和Eric S. Lander作为共同通讯作者在Cell上发文(Suhas S.P. Rao为第一作者),将dilution Hi-C升级成为in situ Hi-C,以超高分辨率1kb解析了人类基因组三维结构图谱。原位Hi-C使用完整的细胞核进行后续反应,减少了稀释Hi-C中随机连接造成的背景噪音,且使用四碱基酶MboI进行酶切,提高了分辨率,实验时间也由稀释Hi-C的7天缩短至3天。这里我们暂且认为是Hi-C 1.5版本。
In Situ Hi-C (2014, Cell)
03
2017年,Job Dekker作为通讯作者在Methods上发表了Hi-C 2.0版本,进一步优化了实验细节,如酶切后采用热激代替SDS灭活,未连接片段去除末端标记的生物素从而降低dangling ends比例等。
04
在此期间,Job Dekker还与Oliver J. Rando等合作参与发明了Micro-C技术(2015,Cell),使用微球菌核酸酶MNase代替限制性内切酶,进一步显著提高了互作图谱的分辨率。后来,他们发现Micro-C可能会损失一些远距离的互作,于是使用双交联剂对细胞进行交联,从源头上交联到更多的互作,将其升级成为Micro-C XL(2016,Nature Methods)。
在这些技术不断升级的过程中,研究人员注意到了有两个影响Hi-C结果的重要因素,一是交联剂,二是片段化DNA的酶。
不同的交联剂,由于分子臂的长度不同,使其可以交联到的空间距离不同,最终就会影响互作的结果。比如,最常用的交联剂甲醛(Formaldehyde,FA)的可交联半径为2-Å,空间距离稍远的DNA和蛋白就无法被交联上。而另外两种分子臂更长的交联剂则可以实现更远空间距离的交联,即disuccinimidyl glutarate (DSG, a 7.7-Å crosslinker)和ethylene glycol bis(succinimidyl succinate) (EGS, a 16.1-Å crosslinker)。因此,若使用双交联剂,则预期可以捕获到更多的空间相互作用。
交联剂:FA、DSG、EGS
另外一个影响因素则是片段化DNA的酶,不同的酶会将DNA切成不同大小范围的片段,进而影响到互作分辨率,如酶切后片段大小:六碱基单酶HindIII > 四碱基单酶 > 四碱基双酶 > MNase。酶切示意图如下所示。
不同的酶将DNA切成不同大小范围的片段示意图
那么,问题来了
使用不同的交联剂、不同的酶,得到的结果会有什么差异?使用哪种交联剂、选择哪种酶,能得到更好的数据结果?
为了回答这些问题,Job Dekker团队再次出马,系统比较了使用不同的交联剂包括双交联,以及不同的酶进行Hi-C后得到的数据结果差异,并在此基础上提出了用于分析空间互作的行业标准级技术Hi-C 3.0版本,文章于2021年9月发表在Nature Methods期刊。
在此研究中,作者使用了上述提到的3种交联剂和4种酶,对人类的5种不同细胞样本进行了Hi-C,产生了大量的数据用于系统性比较分析。
实验设计
文章主要结果
1.双交联(先使用FA交联,再使用DSG或EGS交联)可以提高染色体内互作(顺式Cis)比例,减少染色体间互作(反式Trans)
对于染色体水平的基因组来说,反式互作的比例过高通常会被认为是背景噪音(特殊处理或人工改造的样本除外),作者发现即便使用不同的酶,在不同的细胞样本中,双交联均减少了反式互作的比例,因此可以认为双交联能够减少随机连接造成的背景噪音。
双交联降低了反式互作的比例
从互作图谱和具体的比例来看,双交联甚至能够使反式互作比例降低达百分之二十以上。
双交联降低了反式互作的比例
2.检测compartment的能力:双交联 > 单交联
作者评估了在检测compartment能力方面,发现双交联强于单交联。从以下结果可以看出,顺式互作中大多数的实心圆圈和实心倒三角表示的双交联的位置相比实心方框表示的单交联的位置更靠右上角,即检测到的A、B compartment的强度均更强一些。
双交联能够更好的检测compartment
3.检测compartment的能力:长片段 > 中片段 > 短片段
同时,作者也注意到长片段HindIII检测到的compartment强度最强,而片段最短的MNase检测到的compartment强度相对最弱,片段大小介于两者之间的数据则检测到的compartment强度也介于两者之间,从而说明长片段数据在检测compartment能力方面具有优势。
长片段能够更好的检测compartment
4.不同实验方法鉴定 TAD的能力相当
作者通过分析insulation scores of boundaries,发现不同的酶,不同的交联剂,检测到的TAD数量和边界强度均相当,并且不依赖于数据量深度,这说明TAD结构的检测对于这些参数的变化并不敏感。
不同实验方法鉴定 TAD的能力相当
5.检测 loops 的能力:双交联 > 单交联;短片段 > 长片段
接下来作者从loop层面进行了分析,结果发现双交联检测到的loop数量和强度比单交联更多更强,短片段则强于长片段。而且双交联和短片段检测到的特异loops富集H3K4me3 and H3K27ac,结合其他分析进一步说明了更多的活跃启动子和增强子的互作被检测到了。
双交联和短片段能检测到更多的loops
双交联和短片段检测到的特异loops富集H3K4me3 and H3K27ac
综合以上信息,我们对检测三维结构三个层级的能力可以简洁总结如下,此时,可以看出采用双交联和双酶切的方法可以同时兼顾compartment和loop的检测,于是,作者将这种新的方法命名为Hi-C 3.0:FA+DSG-DdeI+DpnII,并对其进行实验和分析结果比较。
6.Hi-C 3.0能同时更有效的检测compartments和loops
通过实测数据比较分析发现,结果确实如此,如下图所示顺式互作中实心黄色圆圈表示的 Hi-C 3.0能够比传统单交联或单酶切检测到更多的loops和更强的compartments。
Hi-C 3.0 能同时有效检测compartments和loops
7.Hi-C 3.0能同时检测到更多的短距离和长距离互作
虽然MNase的方法检测到了最多的短距离互作,但是其检测长距离互作的能力却最差,原因是其将片段切得太碎,而Hi-C 3.0避免了长距离互作丢失的问题,兼顾到了捕获短距离和长距离互作的能力。
Hi-C 3.0能同时检测到更多的短距离和长距离互作
综上所述,在研究基因组的空间互作时,相比常规Hi-C,双交联+双酶切的Hi-C 3.0是更优的选择,尤其对于一些基因组较大的物种,相同的数据量可以获得更多的互作信息和更强的互作信号。正如作者文中所述。
Hi-C 3.0数据使用Pairtools质控
不同于常规Hi-C数据使用HiC-Pro质控,由于双酶切产生的酶切位点和连接形式的多样性,数据质控时不再适用于HiC-Pro流程中在酶切位点连接处分段比对策略,在此文章中,作者使用Pairtools软件对Hi-C 3.0数据进行质控,再使用cooler软件生成互作图谱文件。软件的代码已公开可供使用。
Pairtools:
https://github.com/mirnylab/pairtools
Cooler:
https://github.com/mirnylab/cooler.git
Hi-C 3.0数据使用Pairtools质控
永利集团3044Hi-C 3.0实测数据
接下来,我们来看永利集团3044的Hi-C 3.0实测数据结果。首先,使用Pairtools对常规单交联单酶切Hi-C数据进行质控,看看会是什么结果。
下表是永利集团3044的常规Hi-C (单交联+单酶切)的小测数据使用HiC-Pro的质控结果,样本为人的细胞,有效数据率高达~87%,反式互作比例~27%,数据质量可谓上乘。
使用HiC-Pro对常规Hi-C小测数据进行质控的结果
然后,我们使用Pairtools对此数据进行质控,从以下结果可以看出,反式互作比例~25%,与使用HiC-Pro质控的反式互作比例相当,而Pairtools输出的结果中cis-1kb+(大于1kb的顺式互作)可认为是valid pairs,这一比例约为57%,即相当于上述HiC-Pro中的87%,那么为什么少了30%呢?这是由于cis-1kb以下的数据(小于1kb的顺式互作)被过滤掉而没有被统计进去,因为小于1kb的互作实际上是不会进入到后续的互作分析中的。此外,还可以看出1~10kb之间的短距离的顺式互作比例是比较低的。
使用Pairtools对常规Hi-C小测数据进行质控的结果
最后,我们使用人类细胞系进行了Hi-C 3.0的测试,除了甲醛以外,分别使用了DSG和EGS进行二次交联和双酶切,并各构建了2个重复文库,如下表所示,反式互作的比例均降低到了10%以下,cis-1kb+的比例均高达50%以上,且1~10kb之间的短距离的顺式互作比例也有了显著提高,结果也可谓上乘!
使用Pairtools对Hi-C 3.0小测数据进行质控的结果
总 结
Hi-C技术从2009年的dilution Hi-C发展至2021年的Hi-C 3.0版本,技术发明人Job Dekker和他的合作伙伴们长期致力于技术的更新升级和广泛应用,发表了大量高水平的文章。永利集团3044希望能将这些技术服务于更多的客户,帮助更多老师深入研究基因表达变化的表观调控机制。Hi-C 3.0相比2.0版本能检测到更多的loops和更强的compartment,并兼顾捕获短距离和长距离互作的信息,想研究基因组空间互作的老师们,请联系我们哦,永利集团3044Hi-C 3.0竭诚为您服务~