图1 文章发表信息
玉米是世界范围内的最重要作物之一,其基因组组装对玉米基础研究和分子育种均有重大意义。此外,玉米也是经典的复杂基因组研究的模式植物。自2009年公布玉米基因组草图以来,已有近50个不同玉米自交系基因组被组装。然而,由于玉米基因组大(与人类基因组相近),且拥有超过80%的重复序列,目前已报道的玉米基因组都存在数百或数千个“空白”区域未被解析。
Mo17自交系是经典的玉米杂种优势群Lancaster群的代表。Mo17自交系及其衍生材料在我国玉米生产中被广泛应用。赖锦盛教授团队以Mo17自交系为材料,综合利用了约237×的ONT Ultralong和约69.4×的Pacbio HiFi测序数据,完成了最新的玉米基因组组装,其大小为2,178.6 Mb,每条染色体的端粒到端粒均由一条完整连续的序列组成,碱基精确度超过99.99%。最新的组装不仅在过去高质量组装的基础上增加了1029个基因,还解锁了玉米基因组中结构最为复杂、从未被组装的基因组空白区。这是首个完整的、无间隙的玉米基因组序列,也是首个所有染色体都完整组装的复杂动植物基因组。
图2 玉米Mo17 T2T组装
完整Mo17基因组的组装,使人们第一次有机会对玉米基因组组装中最具挑战性区域的序列和结构特征一探究竟。大部分植物拥有上千个45S rDNA。通过完整组装,研究人员发现玉米的核仁组织区长达26.8 Mb,包含有2,974个45S rDNA拷贝,其区域内rDNA复制和转座子插入模式高度复杂。在此之前,植物中核仁组织区完整组装的物种仅含有数十个45S rDNA拷贝。另外,研究人员还发现玉米基因组内存在主要由TAG三核苷酸重复组成的超长简单序列富集区,长度可达1.56 Mb,包含近30万个TAG拷贝,其中连续的TAG重复序列最长达235 kb。此外,对完整基因组组装的分析也揭示了大量存在于不同着丝粒间和不同亚端粒区的基因组序列和结构变异。这些研究结果对进一步理解高等植物基因组复杂性和功能具有重要意义。
图3 玉米TAG重复阵列和45S rDNA特征
赖锦盛教授为该论文通讯作者。中国农业大学陈建副教授、博士研究生王子健为该论文共同第一作者。中国农业大学金危危教授、宋伟彬教授、赵海铭副教授、辛蓓蓓副教授、黄伟老师、史俊鹏博士后(现已出站),爱荷华州立大学Matthew B. Hufford教授、内布拉斯加大学林肯分校James C. Schnable教授、中国科学院遗传与发育研究所韩方普研究员和刘阳博士为该研究提供了重要帮助。该研究得到了国家重点研发计划、国家自然科学基金、海南崖州湾种子实验室、崖州湾科技城管理局、河南省科技厅以及河南现代种业有限公司的资助。