随着高通量技术的发展,转录组作为“基础”组学已经被广泛接受,且应用在生物学研究的方方面面,并且作为性价比超高的组学技术,无论是在数据挖掘还是作为上游引入都很有价值。
图1.以RNA-seq为研究手段的文章发表(数据来源Pubmed)
技术的大量运用,数据的广泛挖掘,就带来了一个问题---文章应该怎么写?那么今天小白日志也来汇总一下,一篇合格的转录组文章往往会有那些结果。
1
提出问题
无论是什么研究,起点都是科学问题的提出。而科学问题的提出肯定不能凭空想象,你们可能就来自于几个方向,如基于已有研究提出进一步问题、根据已有现象提出,合理假设或通过构建模型寻找到了显著差异….
虽然科学问题的提出只是第一步,但是如果一开始就找准方向,那肯定事半功倍。
图2.问题提出举例
2
表型&生理指标
问题提出后,最有利且直观的证据肯定就是表型的支撑,往往课题设计的第一步也会是生理指标的检测以及采集,如体重、高度、物质含量、免疫荧光等。这一部分是研究的骨架或者地基,后续的结论都需要能支撑表型的变化。需要描述发现的变化或趋势,简述可能有潜在的影响,从而引入后续研究
图3.理化指标&生化数据举例
3
数据表征
当收集好材料后,进行了转录组测序,在拿到数据后,第一步肯定是需要论证数据的有效性,也有一些常见的指标可以表征如:数据产出、质量值、比对率等,这些是数据分析的基础,发文章时通常会要求附表提供,目的是描述研究中数据量、测序质量的充足、可靠。
图4.数据表征举例
4
差异解析
转录组的核心是寻找差异基因,但是拿到差异基因往往只是第一步;对于差异的解析是数据挖掘的重中之重,常见的描述差异情况的方式有热图、维恩图等;而探究差异机制的方式有GO/KEGG富集分析、WGCNA分析等等。主要是描述差异情况,以及得到的候选基因集&模块,为进一步的实验或后续研究提供方向。
图5.差异解析常见图示
5
验证实验
对于转录组的结果,往往需要通过验证实验,来进一步提升数据的可靠性,常见的方式有q-PCR、Northern blot等;当然也可以结合下游去进行基因的过表达或敲除、敲减去进行验证。转录组的验证最好可以结合到表型以及下游,在验证的同时,往往也是后续研究的起点。
图6.验证结果图示
总 结
对于科学的解析不能一概而论,但是解析的思路是可以借鉴的,无论是对于新数据的采集还是老数据的挖掘,取其共性,挖其特性都是不二法则。特别是在测序方向,往往思路都可以达到“一通百通”小编也汇总了一下常见思路,希望可以帮助老师们扩宽思路。