玉米和高粱三代比较转录组研究
物种:玉米和高粱
样品选择:玉米(B73)和高粱(BTx623),11个不同组织样品(根、茎、叶、叶耳、穗、花粉、胚芽、胚乳、果皮、须和苞片)
测序策略:Illumina+PacBio
研究结果:
1、转录组数据分析
通过Iso-seq分别获取玉米和高粱11个组织的高质量转录组测序数据,获得6,893,280 reads。玉米测序数据比对到参考基因组,其中1,570,093(96.7%)能匹配到参考基因组;高粱比对到参考基因组,其中979,305(89.5%)能匹配到参考基因组。
2、Isoform的检测
与注释参考基因组相比,玉米和高粱Iso-seq获得大量新转录本,将这些转录本进行分类统计。
转录本的统计和分类
3、组织特异性的isoform和AS
进一步研究不同发育时期和不同组织的转录本特异性和共有性,并进行统计;在玉米和高粱中,分别有18,741 (45%) 和 13,327 (38.5%)个基因存在可变剪接事件。
可变剪接事件的统计
4、AS事件研究
通过全长转录组测序,识别了大量可能有可变开放阅读框和早期终止密码子的isoform;候选NMD为:玉米中136,745个isoforms有55,080(40.3%)个,高粱中95,380个isoforms有34,322(36%)个。玉米和高粱中,Non-NMD isoforms比NMD isoforms高表达。同时还通过研究高粱和玉米的保守区域,探究了二者之间的保守关系。
NMD和 non-NMD表达量分析
5、玉米和高粱中的多聚腺苷酸化(APA)
APA是常见的调节机制,可变的Poly-A信号,在玉米和高粱中十分常见。通过对每个组织中表达的全长转录本的近上游元件区域(NUE)进行研究,分析二者APA的发生情况。
玉米和高粱中APA特性
6、lncRNA的鉴定和比较分析
通过对编码潜能的的预测筛选,在高粱中获得了1706个新lncRNA,玉米中发现了39个新lncRNA。总体而言,玉米和高粱在染色体上的分布相似,与基因分布一致。
玉米和高粱基因组之间比较特征的可视化
7、玉米和高粱转录组进化研究
为了研究进化中基因表达模式的变化。通过使用系统发育等级,将每个基因赋予一个系统等级值(PS);在对比分类中将PS1~PS3定义为进化年龄高,PS11~PS1定义为进化年龄低,即更为“年轻”的基因。总体而言,玉米对比与高粱而言,其存在更多的“年轻”基因。
玉米和高粱基因年龄比较