一口吻公布6篇Nature、15篇子刊,史上最大规模揭秘癌症庞大性

  • 时间:
  • 浏览:197
  • 来源:世界杯买球盘口网址app

量子位 报道 | 民众号 QbitAI

这一次,科学界以前所未有的规模,揭秘了癌症的庞大性。

规模有多大?Nature一口吻公布6篇论文 (一篇封面),子刊公布15篇论文。

△论文之多,一屏装不下

Nature的这6项研究来自全基因组泛癌分析(Pan-Cancer Analysis of Whole Genomes, PCAWG)同盟,这是他们迄今为止最为全面的癌症基因组荟萃分析:

涵盖38种肿瘤的2658个癌症基因组举行了测序和分析。

以往的研究主要集中在癌症基因组的卵白编码区域,而此次是分析了整个基因组。

这6篇论文,每篇都从差别方面研究了癌症遗传学,这对于明白癌症的完整遗传庞大性至关重要。

正如Nature评论称:

癌症和云基因组学里的一个里程

那么,接下来量子便带大家对6篇论文举行一一解读。

全基因组泛癌分析登上Nature封面

封面文章:Pan-cancer analysis of whole genomes

封面论文汇总信息,概述了PCAWG数据集的广度和深度。

研究人员陈诉了38个肿瘤类型中,2658个泛癌基因组及其匹配的正常组织的综合分析,其中包罗2605个原发肿瘤和173个转移灶或局部复发。

研究数据来自1469名男性(55%)和1189名女性(45%),平均年事为56岁(规模为1-90岁)。

平均而言,每个癌症基因组均携带4-5个驱动突变(driver mutations),从而为癌细胞提供了选择性优势。

研究涵盖的38种肿瘤之中,仅有5%没有发现驱动突变。

许多癌症体现出了被称作染色体异常(占肿瘤17.8%)和染色体脱色(占22.3%)的基因组突变标志,这导致了基因组的主要结构发生变化。

这也就意味着,大规模结构突变在癌症当中发挥着广泛的作用。

研究数据可供全球癌症研究人员下载(地址见文末)。

Analyses of non-coding somatic drivers in 2,658 cancer whole genomes

在这项研究中,研究人员着手确定非编码DNA中的遗传驱动因子。

准确检测非编码区突变要比检测编码区突变难度更大,因此研究人员提出了两种驱动突变发现方法。

研究展现了新的非编码区驱动突变,好比关键肿瘤抑制基因TP53的5‘端非编码区中发生的庞大突变,FKBIZ和TOB1的3’端非编码区中发生的突变,BRD4的局灶性缺失,以及AKR1C基因位点的重排。

同时,检测效果也对已往发现的个体突变提出了质疑,好比长链非编码的RNA NEAT1和MALAT1。

另外,端粒酶基因TERT的非编码区中相对频繁的突变导致了端粒酶的过表达,这会加助肿瘤细胞不受控制的破裂。

在第三篇和第四篇论文中,重点放在了叫做标签 (signature)的基因组畸变。这里的标签是指奇特性的DNA序列或单核苷酸位点。

诸如缺陷性的DNA修复机制,或者袒露于情况诱变剂,都市发生特征性的DNA畸变模式。

若是要完善已知的突变标签并发现新的突变标签,那么更大规模的基因组数据集就很是重要。

第三篇论文来自Ludmil B. Alexandrov团队:

The repertoire of mutational signatures in human cancer

在这项事情中,研究人员使用来自4645个全基因组的84729690个体细胞突变和包罗大多数癌症类型的19184个外显子序列来表征突变特征,确定了49个单碱基替换,11个双碱基替换,4个聚类碱基替换和17个小的插入和删除签名。

与以前的分析相比,由于数据集的庞大规模使研究人员能够发现新的签名,分散重叠的签名,并将签名剖析为可能代表相关但差别的DNA损伤、修复和/或复制机制的组件

通过预计每个签名对单个癌症基因组突变目录的孝敬,我们展现了签名与外源性或内源性袒露以及缺陷DNA维持历程的关联。

第四篇论文是来自Yilong Li团队:

Patterns of somatic structural variation in human cancer genomes

在这项研究中,使用的数据来自国际癌症基因组协会(ICGC)、癌症基因组图谱(TCGA)和全基因组全癌基因分析(PCAWG)协会,开发了对体细胞结构变异举行分组、分类和形貌的方法。

研究人员确定了16种结构变异标签,好比展现了两个结构变异标签—-缺失和相互倒位(reciprocal inversion)—-之间存在推定的机理联系。

他们还相识所有16个标签在癌症中的作用。某些DNA修复基因中的突变显示与特征性的癌症标签相关。好比,PCAWG发现基因CDK12中的突变与重复DNA的串联片段相关,而且DNA修复酶MBD4的截短变异与涉及称为CpG位点的DNA序列的奇特突变标签同时泛起。

这些新的标签为明白癌症发生机制以及诱变袒露在这个历程中的作用奠基了基础。值得注意的是,Li及其同事是最早发现涉及结构变异的可重现标签的人之一。

第五篇论文来自Moritz Gerstung团队:

The evolutionary history of 2,658 cancers

研究人员发现在给定癌症中最常见的驱动突变也往往最早泛起。

同样,如果在某种特定的癌症类型中拷贝数增加很是频繁地泛起,那么它们往往会较早发生。好比,在透明细胞肾癌中,一部门染色体中的拷贝数增加很常见,倾向于在这种疾病发生的早期泛起。相反,全基因组重复是这种癌症中相对较晚的事件。

最后,他们发现至少40%的肿瘤中的突变标签会随时间变化。这些变化反映了情况袒露在疾病希望中的作用逐渐削弱,以及DNA修复缺陷的发生频率和严重性增加。

总体而言,他们的研究效果讲明,驱动突变可以在癌症确诊之前数年发生,这对癌症的早期发现和生物标志物开发具有重要意义。

最后一篇论文是Genomic basis for RNA alterations in cancer

研究人员们使用具有匹配转录组数据的1188个PCAWG样本,将DNA和RNA的改变功效性地联系在了一起。

他们确定了649个影响基因表达的体细胞单核苷酸DNA突变,其中68.4%与该基因侧翼非编码区相关。

另外,他们还发现了1900个与体细胞突变有关的剪切改变。包罗Alu元件四周的非编码区(内含子)中形成新的卵白编码区(外显子)。

论文指出,有82%的基因融合与结构变异有关,包罗75种新的桥接融合(bridged fusion)(第三个DNA片段插入使两个基因融合在一起)

最终,只管在分析的1188个样本中有87个在DNA水平上没有发生驱动突变,可是研究人员发现每个样本都具有RNA水平的改变。

△影响肿瘤的DNA和RNA改变

该研究效果说明,将RNA和DNA测序分析整合在一起,将在癌症研究中发挥强大作用。

上述6篇Nature论文和15篇Nature子刊论文,以前所未有的规模展现了癌症的遗传庞大性:(加花样)

展现了大规模结构突变在癌症中所起到的广泛作用

在基因调控区域发现了先前未知的与癌症相关的突变

推断了多种癌症类型的肿瘤进化

阐明晰体细胞突变与转录组之间的相互作用

研究了种系遗传变异在调治突变历程中的作用

下一步计划

Nature认为,PCAWG数据集的高质量、高可用性会引发一波生物学方法论的生长。其与其他功效基因组数据的整合,也将推动对遗传异常原因及其结果的进一步研究、明白。

而当前研究的最大的局限性是缺乏有关患者预后和治疗的临床数据,这样的数据能资助研究人员确定可预测临床效果的遗传变化。

幸运的是,国际癌症基因组团结会-加速基因组肿瘤学研究(ICGC-ARGO)项目正在举行中,该项目将为10万多名癌症患者缔造这种资源。

PCAWG简介

全基因组泛癌分析(PCAWG)研究是一项国际互助,旨在确定来自国际癌症基因组同盟的2600多个癌症全基因组的常见突变模式。

在先前研究癌症编码区事情的基础上,本项目探索了编码区和非编码区体细胞和生殖系变异的性质和结果,特别强调了顺式调治位点、非编码RNA和大规模结构改变。

为了便于差别肿瘤类型之间的比力,所有肿瘤和匹配的正常基因组都经由了一套统一的比对和变异挪用算法,而且必须通过一套严格的质量控制测试。

此外,PCAWG事情组已经发生了大量的衍生数据,包罗供体临床和组织病理学数据、亚克隆重建、纯度和倍性信息、剪接亚型和突变特征。

这些数据可从如下链接下载:

https://dcc.icgc.org/releases/PCAWG

传送门

论文集地址:https://www.nature.com/collections/afdejfafdb

https://www.nature.com/immersive/d42859-020-00001-y/index.html

Nature报道:https://www.nature.com/articles/d41586-020-00213-2?utm_source=twitter&utm_medium=social&utm_content=organic&utm_campaign=NGMT_USG_JC01_GL_Nature

— 完 —

诚挚招聘