杏(Prunus armeniaca L.)隶属于蔷薇科李属,是一种风味独特的水果,具有重要的营养和经济价值。苦杏仁苷的含量决定杏的甜度/苦味,苦杏仁苷的含量高低是衡量杏品质和适销性的重要指标,也是决定杏品种适应性进化的重要因素。然而,基于全基因组研究苦杏仁苷合成的机制尚未报道,高质量基因组的缺乏限制苦杏仁苷合成机制的深入研究。
近日,塔里木大学研究团队在plants上发表了题为“A Chromosome-Level Genome of ‘Xiaobaixing’ (Prunus armeniaca L.) Provides Clues to Its Domestication and Identification of Key bHLH Genes in Amygdalin Biosynthesis”的研究论文。该研究以新疆‘小白杏’为材料,通过HiFi和Hi-C测序技术构建‘小白杏’的全基因组图谱,鉴定与杏甜/苦性状相关的bHLH基因家族,为苦杏仁苷的调控机制研究提供理论依据,有助于理解杏的进化过程。永利集团3044承担了本研究中基因组的测序与分析工作。
测序策略
PacBio HiFi + BGI +Hi-C
研究结论
1、‘小白杏’染色体水平的基因组组装和注释
研究人员利用HiFi数据组装得到433个contigs,经Hi-C辅助组装将杏基因组锚定在8条染色体上,基因组大小为0.21 Gb,contig N50为3.56 Mb,scaffold N50 为26.73 Mb。BUSCO评估基因组完整性为96.2%,成功构建高质量的‘小白杏’基因组。
通过基因组注释发现‘小白杏’基因组中重复序列占比52.80%,其中LTR占比37.04%,DNA转座子占比12.16%。共预测蛋白编码基因29,157个,平均基因长度2886.86 bp,平均CDS序列长度1036.09 bp,平均外显子长度4.29个,平均外显子和内含子长度分别为243.01 bp和563.53 bp。
图1 杏基因组图谱
2、小白杏’的比较基因组分析
基因家族聚类分析表明‘小白杏’与其近缘物种共有基因家族为12,303个,‘小白杏’特有基因家族904个。基于‘小白杏’基因组构建的15种植物系统发育树显示‘银香白’和‘小白杏’亲缘关系最近,在5.3 Ma前分化,杏与梅亚科在9.6Ma前分化。同时发现‘小白杏’有569个扩展基因家族和1316个收缩基因家族,而‘银香白’有1944个扩展基因家族和1225个收缩基因家族。
图2 基因家族聚类分析以及15种植物的系统发育树
对‘小白杏’显著扩张和收缩的基因家族成员进行GO/KEGG富集分析。结果表明,苦杏仁苷的合成过程中苯丙氨酸N-单加氧酶和β-葡萄糖苷酶基因发生显著扩张,野黑樱苷β-葡萄糖苷酶基因和苦杏仁苷β-葡萄糖苷酶基因和β-葡萄糖苷酶基因发生显著收缩;正选择基因在氰基氨基酸代谢通路中显著富集。
图3 显著扩张基因家族KEGG基因分类和代谢途径
图4 显著收缩基因家族KEGG基因分类和代谢途径
3、‘小白杏’苦杏仁苷合成机制关键调控因子bHLH转录因子的鉴定
苦杏仁苷的生物合成依赖于苯丙氨酸代谢,bHLH基因家族参与苦味的合成。从‘小白杏’基因组中鉴定到88个bHLH基因,命名为ParbHLH1-ParBHLH88,其中ParbHLH66与rna-Par24659.1是同一基因。系统发育分析结果表明ParbHLH66(rna-Par24659.1)基因是调控杏仁苦甜的关键基因,其基因编码的氨基酸序列在梅、扁桃、桃、甜樱桃等物种中高度保守。
图5 不同物种bHLH蛋白的系统发育树分析
杏bHLH基因家族高度保守,具有共同的结构,内含子数量从0个到20个不等。ParbHLH基因存在于每条染色体上,但分布不均。Ka/Ks比率结果表明,ParbHLH66与ParbHLH65、ParbHLH67、ParbHLH68和ParbHLH69形成串联重复基因簇,该基因簇与拟南芥中多个bHLH基因存在良好的共线性,可能参与‘小白杏’苦杏仁苷的生物合成。此外,bHLH基因家族启动子的顺式调控元件分析显示在ParbHLH基因启动子中鉴定出参与胚乳特异性表达和参与种子特异性调控的顺式作用调控元件。ParbHLH66基因的启动子主要包含参与分生组织表达、厌氧诱导、水杨酸反应、脱落酸反应、赤霉素反应、低温反应和光反应的顺式元件。
图6 bHLH基因启动子关键顺式元件的鉴定及GO富集
结 论
本研究报道了‘小白杏’高质量的染色体水平基因组组装,同时鉴定出88个bHLH基因,其中ParbHLH66 (rna-Par24659.1)是决定甜/苦杏仁的关键基因。这些基因可能参与苦杏仁苷生物合成的调控,为其适应性驯化的潜在机制提供新的见解。
华中农业大学罗正荣教授为该论文通讯作者。塔里木大学郭玲教授为该论文第一作者。该研究得到了国家重点研发计划(基金号:2019YFD1000600)和国家自然科学基金(基金号:31760560和32160694)的支持。