近日,中国环境科学研究院环境基准与风险评估国家重点实验室安立会教授团队在Aquatic Toxicology(IF=4.9)期刊上在线发表了题为“Single Molecule Real-time Sequencing Revealing Novel Insights on the Response to Estrogen and Androgen Exposure in Freshwater Snails”的研究论文,该研究采用Iso-seq方法鉴定出了淡水螺(P.striatulus)优于以前的转录本信息,并丰富了转录本的注释内容;二三代数据结合,研究了雄雌性激素对淡水螺的影响,为了解其相关分子功能做出了重要贡献,也为其他软体动物进一步进行多样化的遗传和生理研究提供了参考。永利集团3044承担本研究中的转录组测序、分析等工作。
研究背景
内分泌干扰物(EDCs)是一种可以干扰无脊椎动物生理功能的环境物质。有研究表明,暴露于低剂量EDCs的环境会导致腹足类物种性异常。但由于这些物种的转录组和基因组的分子信息有限,EDCs在软体动物中的具体分子机制仍有待研究。雌激素和雄激素等类固醇激素是调节生物体发育、生长和繁殖的重要调节因子。此前相关研究主要集中在二代测序,本研究选用的Iso-seq测序则可以克服读长短的局限性,得到更完整的转录本和异构体信息。首次探讨了模型雌激素17β-estradiol(E2)和雄激素17α-methyltestosterone(MT)对淡水螺基因表达的影响。早期已有研究表明,E2和MT在软体动物的内分泌功能和繁殖方面起着至关重要的作用。同时软体动物也对环境中的这些物质高度敏感。本研究使用PacBio Iso-seq结合Illumina RNA-seq技术来提高纹沼螺的转录组注释和准确性。进一步研究了暴露于E2和MT后纹沼螺的转录本变化。
材料方法
实验设计:培养成年的纹沼螺分别暴露于乙醇(0.01%)、乙醇(0.01%)+E2(50 ng/L)和乙醇(0.01%)+MT(50 ng/L)的环境中,于暴露24小时、48小时和96小时三个时间点取样(n=5)。取样后按性别混样进行RNA-seq;全样本混样进行Iso-seq。
图1 技术路线
研究结果
1
●
RNA-seq组装和注释
使用Trinity软件进行组装,最终获得了490771个转录本,平均长度为955bp,N50为1691bp,并与Nr、Nt、GO、KO、COG和Swiss-Prot六个数据库进行比对(表1)。与之前的转录本相比较,本次数据的质量和功能注释的百分比方面都有了显著的提升。
表1 RNA-seq和Iso-seq注释结果
2
●
Iso-seq组装和注释
使用PacBio建立三个文库(0~2kb、2~3kb和3~6kb)获得总共587016个CCS reads,生成了484121个FLNC序列,平均长度为2210bp。数据过滤后,isoforms平均长度为2272bp,N50为3087bp,同时使用二代数据对Iso-seq数据进行校正。总共产生了216598个独特的非冗余全长转录本(图2),平均长度为2478bp,N50为3304bp,有49.06%的转录本成功预测到了完整ORF。此外将Iso-seq数据构建为参考转录本,发现RNA-seq数据中超过60%成功比对。RNA-seq数据的成功定位表明完整的ORF提高了功能基因预测和注释的效率,尤其是在缺乏参考基因组的情况下。同样也使用6个数据库对转录本进行注释,结果显著高于现有RNA-seq结果。
结合二三代数据,我们发现RNA-seq和ISO-seq对异构体的部分具有相同的注释(图2)。基于转录本功能注释的统计分析,Iso-seq的数据质量明显高于RNA-seq,这表明SMRT测序由于测量出了大量的全长转录本,使得在无参情况下组装参考转录本成为可能。这些数据为未来揭示环境化学物质对蜗牛和其他无脊椎动物影响的潜在分子机制研究提供了更有价值的信息。
图2 A.全长转录本分布;B.ORF分布;C.二三代注释对比
3
●
差异基因分析
进一步进行差异表达分析,从不同处理组中获得了1585~13229个差异基因。结合二三代测序数据,计算出所有样品中异构体表达水平的相似分布模式,并进行统计。同时对差异基因进行了GO和KEGG富集分析(图3)。发现几种膜受体基因的表达水平出现明显差异包括多巴胺受体(DR)、FMRFamide受体(FMRFaR)、神经肽Y受体(NYR)和神经肽FF受体(NFFR)。
进一步比对差异表达中与同类型生物存在相关性的基因,以揭示E2和MT对螺的调控模式。但标记为ER(雌激素受体)和ERR(雌激素相关受体)的基因并未出现差异表达,这可能与不同物种的调控模式有关。
图3 差异基因GO和KEGG富集分析
4
●
注释为膜受体的转录本表达
本研究进一步对发现DR、FMRFaR、NYR和NFFR在E2和MT暴露的情况下呈现出显著的性别和时间依赖性。与此前研究中提及的在EDC影响中,非经典核受体在软体动物中可能扮演比核受体(ER)更重要的作用。
考虑到受体在暴露于污染物后可能不会发生显著变化,而是对下游过程产生更显著的影响,这些基因和其他潜在的膜相关受体的动态表达模式还需要进一步研究。
图4 qPCR检测膜受体基因表达
结论
本研究通过使用Iso-seq的方法,成功鉴定到在EDCs环境下,膜受体的差异变化。这些发现暗示非经典核受体可能在接触EDC后,在软体动物中发挥关键作用。本研究中获得的信息对后续研究EDCs对P.striatulus影响具有重大意义,也为后续其他软体动物的进一步研究提供有价值的参考。
本研究通过结合二三代的转录组数据,利用Iso-seq的优势,构建了高质量的参考转录本。通过不同组间的差异分析,去确定需要关注的关键基因,然后再通过qPCR等方法进行验证。这种二三代结合的思路十分经典,为其他无参物种的研究提供了思路。同时我们从研究中也可以发现,三代全长转录组可以发现很多传统二代测序无法检测出来的生物学信息,而这些信息很可能是我们需要关注到的内容。二代测序和三代测序的联合使用是全面获得转录信息的最佳手段。
Tips:永利集团3044全长转录组正在进行开学促销,心得不如赶快行动。
加量不加价,
全长转录组助力科研666!
活动细则:三代PacBio全长转录组免费由40G升级到50G,即50G三代全长转录组价格与之前40G价格相一致。
参考文献:
https://doi.org/10.1016/j.aquatox.2021.105953