最初科学家开发Hi-C技术主要目的是基于Hi-C技术来解析基因组三维构象,但Hi-C技术在民间成名还是得益于其在基因组项目中进行染色体水平基因组的辅助组装。来自同一条染色体的HiC互作是强于不同染色体间的,通过这个原理,可根据Hi-C数据的互作强度,将来自于同一条染色体的聚类到一起(group),并在group内进一步排序定向,从而将基因组组装到染色体水平。
相同的道理也可以将Hi-C技术运用到宏基因组的组装中:与不同细胞(微生物)相比,来源于同一个细胞(微生物)内的DNA分子互作更强,基于此原理可将来自于同一种微生物的contigs序列聚类到同一个groups中,并对group进行物种鉴定。
Hi-C宏基因组组装目前已广泛应用到环境中难以培养的微生物的基因组辅助组装中,见下文分享。
Hi-C提升宏基因组组装结果
Identification of a novel interspecific hybrid yeast from a metagenomic spontaneously inoculated beer sample using Hi-C
Yeast,2018
研究者对自然接种的啤酒样本进行宏基因组和Hi-C分析,在宏基因组组装结果基础上,通过Hi-C互作数据将11,189 contigs 聚类到8个groups,这些contigs占宏基因组组装结果的73.3%(49,498,624bp ),8个groups中有7个可以注释到种水平的真菌或细菌(Figure 1和Table 1),另外一个groups无法比对到已知的菌株参考基因组。该groups可比对出2个基因组,一个可比对到P. membranifaciens,另外一个未知,推测是一种新型的中间杂交酵母。研究者后续对该杂交酵母进行了分离培养测序,进一步验证了上述宏基因组Hi-C的结果。
Figure 1 Hi-C聚类结果和热图展示
案例二 宏基因组+Hi-C组装913个瘤胃微生物基因组
Assembly of 913 microbial genomes from metagenomic sequencing of the cow rumen
Nature Communication,2018
Figure 2 瘤胃中913基因组草图与公开数据构建系统进化树
案例三 Hi-C将耐药基因组和质粒基因组与宿主微生物基因组关联
Linking the resistome and plasmidome to the microbiome
The ISME Journal,2019
研究者构建了2类废水样本,1份不做处理,命名为WW,1份添加了~7 × 10^7 CFU/mL的E. coli K12::gfp,该菌株含有多重耐药质粒pB10::rfp,命名为WWEC。
两份样本分别进行宏基因组和Hi-C分析,Hi-C数据分别将2份样本的宏基因组组装的contigs聚类得到1000个以上clusters,其中分别有51(WW)和38(WWEC)个clusters的组装完整性高于80%(Figure 3)。
Figure 3 Hi-C聚类的cluster完整性和污染率评估
宏基因组Hi-C更多应用优势
Hi-C除了能提升宏基因组组装,将基因组组装到种和菌株水平,更多应用优势超乎你的想象。
1.重现宏基因组中丢失的质粒基因组
在案例2中瘤胃微生物进行宏基因组Binning组装,通常会被过滤掉质粒序列,而通过宏基因组Hi-C分析,研究者可将来自于10个不同细菌基因组中10条质粒contigs保留。
在案例3中WWEC样本Hi-C聚类得到的EC基因组,包含了1个cluster (4.2 Mbp) 和3个小的相似丰度的clusters (共480 Kbp),比对到大肠杆菌基因组上,完整性超过97%(Figure 4),完整地重现了WWEC中添加的大肠杆菌和质粒基因组信息。
2.Hi-C互作关联质粒与宿主微生物
在案例2瘤胃微生物中,经宏基因组Hi-C得到的10个质粒。在Hi-C互作热图上,展示了这10个质粒(横坐标)与63个细菌中部分基因组(纵坐标)的互作强度,根据互作强度强弱,可将质粒关联到其宿主微生物(Figure 5)。
其中2个contigs(NODE_52225_length_2785_cov_42.9597和NODE_49376_length_2919_cov_46.8415)可比对到蓝瘤胃球菌质粒pRUMAL02,该质粒可编码dockerin-containing proteins。在Figure 5互作热图中的篮框标注可以看到,这2个contigs在4个不同细菌中共享(hRUG877, hRUG853, hRUG861,hRUG867),推测编码碳水化合物降解蛋白的质粒可能在这些不同的物种间共享。
Figure 5 瘤胃中经宏基因组Hi-C组装质粒基因组与微生物基因组互作关联热图
永利集团3044专注于Hi-C技术在科研中应用开发,除了将Hi-C技术成熟应用到医学和动植物育种等领域,也将Hi-C技术应用到微生物研究领域,基于Hi-C辅助宏基因组的优势菌的基因组组装,关联质粒与其宿主微生物基因组,宏基因组Hi-C的应用也不会止步于此,更多应用,下回分享。
参考文献:
1.Smukowski Heil C, Burton J N, Liachko I, et al. Identification of a novel interspecific hybrid yeast from a metagenomic spontaneously inoculated beer sample using Hi‐C[J]. Yeast, 2018, 35(1): 71-84.
2.Stewart R D, Auffret M D, Warr A, et al. Assembly of 913 microbial genomes from metagenomic sequencing of the cow rumen[J]. Nature communications, 2018, 9(1): 870.
3.Stalder T, Press M O, Sullivan S, et al. Linking the Resistome and Plasmidome to the Microbiome[J]. The ISME journal, 2019: 1.