近年来,基于SNP的全基因组关联分析(SNP-GWAS)在动植物群体遗传学中得到广泛应用。然而,随着科研人员对结构变异(SV)的日趋重视,人们逐渐发现相比于SNP,SV能解释更多的遗传变异现象(例如驯化、抗病、抗逆性),基于SV的GWAS分析也相继应用在玉米、黄瓜、葡萄、小麦、番茄等物种中。
2020年10月,Genome Biology 在线发表了题为“An integrated peach genome structural variation map uncovers genes associated with fruit traits”的研究论文,该研究通过对336份桃个体进行深度测序,获得了全面的SV变异图谱,随后基于SV-GWAS鉴定到与26个农艺性状相关联的候选基因,为后续桃树的基因组和遗传育种研究提供了宝贵资源。
图1 文章发表信息
研究背景
结构变异(structural variations,SV)在基因组中广泛存在,包括插入、缺失、复制、倒位和易位等。据报道,在许多植物中,SVs可调节农艺性状,如番茄的果实性状、大豆的线虫抗性、黄瓜的生殖形态、柑橘的无性生殖等。尽管SV是植物遗传多样性的重要来源,但SV对桃基因组和农艺性状的影响在很大程度上仍然未知。通过对桃树进行SV检测,并进行SV-GWAS分析,可为桃的遗传育种提供新见解。
研究思路
材料:336份桃个体,包括野生种13份,观赏种20份,地方种70份,改良种233份。
测序:平均测序深度24×,不低于5G的数据。
表型性状:11个质量性状(包括果形、果毛羽、果肉颜色(白色/黄色)、核周围果肉颜色、花形(双/单),15个数量性状(包括节间长度、花/叶芽比、雌蕊和柱头之间的相对高度、缝合深度、果实发育期、发育期、叶长、叶宽、开花日期、盛开日期、开花结束日期、叶片展开日期、果实成熟日期、落叶日期和落叶结束日期)。
1、桃树SV的检测及功能分析
通过对336份桃种质资源进行深度测序(24×),同时结合多种软件进行SV检测,研究者共获得202273个高质量的SV,包括121527个插入和缺失、10728个重复、8336个倒位、61682个易位。基于SV,可将选取的桃分为三大类:观赏品种和地方品种为一组,改良品种组和野生组,与之前基于SNP的群体结构分析结果相一致。此外,研究者随机选取6个品种进行PacBio测序,结果表明基于二代测序检测到的SV准确率为88%。
图2 桃树SV的检测及群体结构分析
基于检测的SV,研究者发现桃树98%的基因都与SV相关,包括20721个编码区,3505个内含子和2135个启动子区,与SV无关联的基因大多与桃树的基本生物过程相关,这说明SVs在基因调控和形态变异中起主要作用。
选择性消除分析表明,基于SNP和SV分别鉴定到的受选择和驯化的区域重叠率仅有11.7Mb,因此研究者随后基于出现频率来选择SV用于驯化和改良区域的扫描。研究发现,在桃进化过程中,总共选择了2268个基因,其中1059个是在驯化过程中选择的,145个是在改良过程中选择的,1064个是在两个过程中都选择的,这些基因显著富集在细胞对刺激和信号反应的通路中。
图3 桃树SV的功能分布与注释
2、桃树26个农艺性状的SV-GWAS分析结果
为了验证SV-GWAS在桃树中的可行性,研究者先选取了8个已经基于SNP-GWAS分析找到候选关联基因的性状,随后分别进行SNP-GWAS和SV-GWAS分析,结果表明SV-GWAS分析结果不仅与SNP-GWAS结果相一致,还包括了一些SNP-GWAS未鉴定到的区域。这表明,在某些情况下,SV-GWAS可以超越SNP-GWAS,能提供更加有效的策略来识别候选基因。基于此,研究者随后重点对果实早熟、果核周围颜色、果实形状进行SV-GWAS分析,并对筛选到的基因做基因功能验证。
(1)桃果实早熟
之前研究表明,4号染色体上的Prupe.4G186800基因编码NAC转录因子,该基因上的9bp插入与果实早熟有关。为验证这一结论,研究者首先对果实早熟性状进行SV-GWAS,发现4号染色体上Prupe.4G186800和Prupe.4G186900有相同的LD-block。但随后在不同MD桃的转录组分析结果中,仅有Prupe.4G186800基因显著表达。这表明Prupe.4G186800中编码NAC转录因子的9bp插入与桃果实早熟有关。
图4 桃早熟性状的SV-GWAS分析及转录组验证
(2)桃果核周围颜色
已有研究表明,PpMYB10.1基因控制桃果肉颜色,但桃果核周围颜色的遗传机制尚不清楚。根据使用SV数据的GWAS分析,发现487-bp 的缺失影响PpMYB10.1启动子区域与该性状相关,并且缺失基因型与果核周围红肉高度相关。qRT-PCR分析表明该缺失与相应果核区域中花色苷的出现相关。在双荧光素酶报告分析中,研究者发现,该缺失增强了启动子活性,与核蛋白激酶B10.1在果核周围肉色形成中的作用一致。此外,研究者发现PpMYB10.1启动子中的缺失是在驯化过程中选择的,在地方品种中的出现频率明显高于野生种质。
图5 桃果核周围颜色的SV-GWAS分析及qRT-PCR、双荧光素酶验证
(3)桃果实形状
桃果实有扁平和圆形两种形状,扁平形状的遗传机制尚不清楚。通过SV-GWAS分析,在6号染色体上确定了1.67-Mb的倒位与该性状相关,且只有杂合子才出现扁平形状。研究者通过PacBio进行局部组装,并与参考基因组比对,验证了该倒位现象的存在。该倒位区域也涵盖了之前基于SNP报道的扁平形状相关的10kb-缺失区域。
最后,研究者为了确定控制扁平形状的最佳候选基因,分别进行了qRT-PCR、番茄转基因体系验证、石蜡切片分析,确定了PpOFP1基因控制果实扁平形状的形成。
图6 桃果实形状的SV-GWAS分析及试验验证
在本研究中,研究者分析了桃驯化和改良过程中SVs对基因组的影响,发现桃中几乎所有的基因都受到SVs的影响,极少数未受影响的基因几乎都参与了核心生物过程。研究者也发现,SV-GWAS比SNP-GWAS在识别候选基因和解释遗传变异方面更有效,并鉴定了与果实早熟、果核周围颜色、果实形状相关的SV及候选基因,为桃树优良品种的选育提供宝贵资源。我们有理由相信,SV-GWAS会在植物群体遗传学中得到更加广泛的应用!