近两年来,随着HiFi测序与ONT超长测序的不断发展,基因组完成图(也称0 gap基因组)逐渐成为基因组研究的新潮流,目前已构建了人、水稻、拟南芥、玉米、香蕉等多个物种的基因组完成图。作为三代测序的领跑者,永利集团3044在基因组完成图方面也积累了丰富的项目经验,首批项目-水稻基因组完成图已见刊于Molecular Plant。为使科研人员能更好了解基因组完成图的技术背景与测序策略,本期小编将详细介绍菲沙在植物、动物与真菌基因组完成图方面的项目经验。
01
植物基因组完成图
水稻基因组完成图
项目背景:客户前期已组装多个版本的水稻基因组(最好的组装版本仅剩7-8个gap),拥有包括BAC、Illumina、Hi-C、PacBio CLR在内的多种测序数据。
测序策略:HiFi(23-103×)+CLR(130×)
组装策略:
组装结果:
组装的水稻基因组大小为391.56-395.77Mb,12条染色体中有10条染色体都实现了端粒到端粒的组装,BUSCO评估基因组完整性为99.88%。
图1 水稻基因组完成图
2
花卉基因组完成图
项目背景:已发表多个近缘种的染色体水平基因组,survey分析表明基因组大小为340Mb,杂合为3%,重复率为40%。
测序策略:HiFi(90×)+Hi-C(200×)
组装策略:Hifiasm+Hicanu
组装结果:
鉴于高杂合,后续对该物种进行了基因组分型,两个单倍型基因组大小分别为340Mb与342Mb,Contig N50=17Mb,60%的染色体仅由1条contig组成,BUSCO评估基因组完整性为98%,这表明组装得到了该花卉的基因组近完成图。
图2 花卉基因组近完成图组装结果统计
3
中草药基因组完成图
项目背景:已发表多个近缘种的染色体水平基因组,survey分析表明基因组大小为500Mb,杂合为1%,重复率为45%。
测序策略:HiFi(40×)+Hi-C(100×)
组装策略:Hifiasm+Hicanu
组装结果:
组装的基因组大小为530Mb,Contig N50=22Mb,其中3条染色体仅由1个contig组成,达到了0 gap水平,BUSCO评估基因组完整性为99%,这表明组装得到了该中草药的基因组近完成图。
图3 中草药基因组近完成图组装结果统计
02
动物基因组完成图
软骨鱼基因组完成图
项目背景:已发表多个近缘种的染色体水平基因组,survey分析表明基因组大小为600Mb,杂合为1%,重复率为30%。
测序策略:HiFi(30×)+Hi-C(100×)
组装策略:Hifiasm
组装结果:
组装的基因组大小为600Mb,Contig N50=25Mb,其中8条染色体仅由1个contig组成,达到了0 gap水平,BUSCO评估基因组完整性为99%,这表明组装得到了该软骨鱼的基因组近完成图。
图4 软骨鱼基因组完成图组装结果统计
2
硬骨鱼基因组完成图
项目背景:已发表多个近缘种的染色体水平基因组,客户需构建同属两个不同物种的基因组完成图。survey分析表明两条鱼基因组大小为570-630Mb,杂合为0.5%左右,重复率为30%左右。
测序策略:HiFi(40-50×)+Hi-C(100×)
组装策略:Hifiasm
组装结果:
组装的基因组大小为650Mb,Contig N50=22Mb,90%的染色体都只由1个contig组成,均达到了one contig,one chromosome水平,BUSCO评估基因组完整性超过99%,这表明组装得到了该硬骨鱼的基因组近完成图。
图5 硬骨鱼基因组完成图组装结果统计
03
真菌基因组完成图
真菌基因组较小,基因组复杂度低于动植物基因组。仅使用HiFi+Hi-C策略即可完成真菌基因组近完成图水平的组装。实际项目中,我们对某真菌(基因组大小50Mb)进行110×的HiFi测序、100×的Hi-C测序,利用Hicanu组装、Hi-C辅助组装后,最终构建的基因组大小为50Mb,Contig N50=4Mb,有3条染色体仅由1个contig 组成,达到了0 gap水平,BUSCO评估基因组完整性97%,这表明组装得到了该真菌的基因组近完成图。
图6 真菌基因组的Hi-C互作热图(近完成图)
丰富的项目经验+专业的服务团队,永利集团3044愿与您携手构建更多的基因组完成图,来深入探讨自然的无穷奥妙。