01
了解基因结构变异
基因结构变异:是基因序列发生了插入、删除、倒置、替换等不同类型的改变,从而导致该基因的功能和表达出现改变。这种变异可以影响蛋白质的合成、调控基因转录和翻译、基因拷贝数量的改变以及染色体畸变等方面。
在人类中,基因结构变异可能会导致一些遗传性疾病,如囊性纤维化、血友病和地中海贫血等。此外,基因结构变异也可能与某些癌症的发生有关。
目前,随着基因测序技术的不断发展,我们对于基因结构变异的理解和检测能力也越来越强。这也为相关疾病的早期诊断和治疗提供了更多的可能性。
02
常见的基因结构变异类型
染色体结构变异(Structural variation,SV):染色体变异的一种,是内因和外因共同作用的结果,外因有各种射线、化学药剂、温度的剧变等,内因有生物体内代谢过程的失调、衰老等。主要类型有缺失、重复、倒位、易位。
单核苷酸多态性(single nucleotide polymorphisms,SNP):基因组某个位置中单个碱基的突变,通常频率大于5%。90%以上的人类变异是由SNP引起, 是导致人类药物代谢和反应差异的主要原因。
插入缺失突变(Insert-deletion,Indel):基因组某个位置中一定长度核苷酸的插入(Insert)或者缺失(Deletion),合称为Indel。
拷贝数变异(Copy number variation,CNV):主要指基因组中1Kb到3Mb长度的DNA片段缺失、插入、倒置和重复等变异统称为拷贝数变异。
DNA甲基化(DNA methylation):最常见的表观遗传修饰,DNA的CG两个核苷酸的胞嘧啶被添加甲基,形成5-甲基胞嘧啶,从而影响基因的表达。
接下来!
让我们一起探索三代测序技术的神奇之处,它能够揭示基因结构变异的细节,为人类疾病的治疗和预防提供新思路。
三代测序技术在转座因子介导重排中的应用
文章题目:Transposable element-mediated rearrangements are prevalent in human genomes
期刊:Nature communications
研究亮点:
转座因子约占人类基因组的一半,它们通过逆转录转座产生人类变异的作用得到了广泛的研究和重视。由转座子介导的结构变异,称之为转座元件介导的重排(TEMRs),目前研究较少,导致它们形成的机制以及它们对人类多样性的更广泛影响也知之甚少。本研究中在三个个体的基因组中鉴定了493个独特的TEMRs。虽然同源定向修复是TEMRs的主要驱动因素,但序列解析TEMR资源允许识别复杂的倒置断点、三倍复制或其他高拷贝数多态性,以及额外的复杂性。TEMRs在基因位点中富集,并可产生潜在的重要风险等位基因,如TRIM65的缺失,这是一种已知的癌症生物标志物和治疗靶点。在这项研究中,作者对三个不同的基因组使用Illumina和PacBio测序数据鉴定了493个非冗余的TEMRs,通过识别所有493个TEMR事件的精确连接推断出TE驱动的缺失、复制和倒位的形成机制,通过PCR和Sanger测序确定70个随机选择的TEMRs的精确连接,并从匹配的定相HiFi基因组装配中验证断点连接的准确性。这些发现扩展了对这类重要的结构变异的理解,即它们形成的负责机制,并将它们作为人类多样性的重要驱动因素。
三代测序解析结构变异在人类疾病中的作用
文章题目:Long read sequencing of 1,817 Icelanders provides insight into the role of structural variants in human disease
期刊:BIORXIV
研究亮点:
在全基因组水平上了解结构变异在群体遗传学中的作用,对未来的医疗保健和科学研究来说至关重要。三代测序有望改善结构变异(SVs)的特征,这是遗传多样性的一个主要来源。本研究中使用ONT技术生成了1817名冰岛人的LRS数据,并确定了每个个体23111个常染色体结构变异的中位数(11506个插入和11576个缺失),累计中位数为9.9 Mb。发现罕见的sv比普通sv更大,更可能影响蛋白质功能。发现了一个与PCSK9第一个外显子的罕见缺失有关。该缺失的携带者的低密度脂蛋白胆固醇水平比人群平均水平低0.93 mmol/L(1.36sd)(pvalue=2.4·10−22)。使用三代测序技术,在每个研究对象的基因组中发现了约23000个结构变异,这个数目是二代测序发现的结构变异数量的5倍。不仅如此,三代测序还发现了更大规模的罕见结构变异。
三代测序靶向捕获技术全面分析乳腺癌基因组的结构变异
文章题目:Detection of Structural Variations and Fusion Genes in Breast Cancer Samples Using Third-Generation Sequencing
期刊:Frontiers in Cell and Developmental Biology
研究亮点:
结构变异 (SV) 是人类基因组中常见的遗传改变,可能导致不同的表型和疾病,包括癌症。然而,使用二代测序检测结构变异受限于其短读长,这限制了我们对结构变异的理解。本项研究中,开发了开发了28-Gene全长Panel,并利用Oxford Nanopore Technologies和 Pacific Biosciences长读长测序平台(TGS),对19名乳腺癌患者的肿瘤、癌旁组织和血液样本进行长读长基因组和转录组测序,分析了乳腺癌相关28个基因的结构变异。结果表明,一些体细胞 SV在所选基因中反复出现,尽管它们中的大多数发生在非外显子区域。我们发现了支持 SV热点区域存在的证据,这扩展了我们之前的理解,即它们仅存在于单核苷酸变异中。采用长读长基因组和转录组测序来鉴定乳腺癌患者的SV,并证明这种方法在临床应用中具有巨大的潜力。
三代测序用于神经发育障碍分子诊断的研究
文章题目:Long-read genome sequencing for the molecular diagnosis of neurodevelopmental disorders
期刊:HGG Advances
研究亮点:
外显子组和基因组测序已被证明是诊断神经发育障碍(NDDs)的有效工具,但很大一部分NDDs不能归因于目前可检测到的遗传变异在一定程度上,是因为许多基因变异很难或不可能通过典型的短读测序方法检测到。本研究中描述了使用三代基因组重测序技术对6个患有NDDs的患者亲本进行测序。我们在每三组数据中识别了变体并创建了从头组装,其全局指标表明这些数据集比短读数据提供的数据集更准确和全面。在一个患者中,发现了一个可能的致病性(LP),即CDKL5介导的l1插入,导致第3外显子的重复,导致移码。在第二个患者中,发现了多个大的从头结构变异,包括影响DGKB和MLLT3的插入-易位,我们发现这些变异破坏了MLLT3的转录水平。研究者认为这种广泛的结构变异可能是致病性的。三代测序技术广泛检测的变异类型和质量,加上在6个无法解释的神经发育障碍患者中找到具有临床和研究意义的变异,支持这样一个假设:三代测序技术可以大幅提高罕见疾病基因发现率。
参考文献:
1.Balachandran P, Walawalkar I A, Flores J I, et al. Transposable element-mediated rearrangements are prevalent in human genomes[J]. Nature Communications, 2022, 13(1): 7115.
2.Beyter D, Ingimundardottir H, Oddsson A, et al. Long-read sequencing of 3,622 Icelanders provides insight into the role of structural variants in human diseases and other traits[J]. Nature Genetics, 2021, 53(6): 779-786.
3.Hu T, Li J, Long M, et al. Detection of structural variations and fusion genes in breast cancer samples using third-generation sequencing[J]. Frontiers in Cell and Developmental Biology, 2022, 10: 772.
4.Hiatt S M, Lawlor J M J, Handley L H, et al. Long-read genome sequencing for the molecular diagnosis of neurodevelopmental disorders[J]. Human Genetics and Genomics Advances, 2021, 2(2): 100023.