盘算医学:跑在超算上的医学

  • 时间:
  • 浏览:213
  • 来源:世界杯买球盘口网址app

谭灼烁(左)与张春明正在分析数据。

2019年对于吴双(假名)而言是最难过的一年。年头,本以为是一场普通伤风引起的咳嗽,却未曾想到在3个月后被诊断为中央型肺腺癌第四期,纵隔淋巴转移,伴远端肾上腺转移。

“拿到诊断陈诉的那一刻,我没有掉一滴眼泪。”说这句话的时候,吴双转头看向窗外,居心将视线避开了记者的眼光,但眼角却渗出晶莹的泪水。

吴双,41岁,是一位都市职业女性。患病后,她和家人跑遍了北京多家知名的三甲医院,实验过靶向药物、化疗、中药等措施,但病情都没有获得缓解。“我还特地花了一万多块钱做了肿瘤基因检测,很遗憾,陈诉显示是没有可用药的基因突变。”

没有相应的“可用药”,又不能通过手术和放疗举行努力干预,这在临床上只能“盲”用药,即实验使用临床上常用的一些药物举行治疗,再定期评估治疗效果。但通常盲用药物治疗的效果只能“听天由命”,而在医院,像吴双这样的患者大有人在。

“即便能检测到相应的基因突变,靶向药物对差别患者的疗效也并不相同。”中国工程院院士、中国医学科学院肿瘤医院主任医师孙燕表现,肿瘤的发生是多基因团结“发力”的效果,虽然通过基因检测等手段可以获得海量的数据,但现有的认识仍集中在个体基因与治疗肿瘤的关系,好比携带了致病性突变的BRCA1/2基因与乳腺癌、卵巢癌的关系,突变的EGFR基因与肺癌的关系等。“是否还会有其他基因的到场、每个基因发挥的作用如何,我们不得而知。”

其实,孙燕的这种困惑,也正是现在肿瘤领域最让人“头疼”的难题。对此,中国科学院盘算技术研究所高性能盘算机研究中心主任谭灼烁在接受《中国科学报》采访时表现,当前,生物医学大数据的规模和发生速度远远超出了普通规模盘算机的处置惩罚能力,急需超算助力科学家从多维、立体、融合的数据中探索出纪律,从而更准确地辅助疾病的诊断和治疗。

“查字典”式的有限应用

自人类基因组计划启动以来,以下一代测序技术(NGS)和质谱技术(MS)为代表的各种组学技术获得了飞速生长,再加上传统的显微镜技术、生化方法、免疫组织化学方法、生理体征检测和临床影像拍摄技术等数据源的聚集,使海量生物医学数据出现指数级增长态势。

不行否认,即便尚未引入信息科学的大型工具,这些大数据也赋予了医生和临床科研人员更多、更细致的维度去相识疾病发生生长历程,大大拓展了医学研究的深度和广度。

“好比,现在对一些明确的、单基因突变引起的疾病,基因组测序已经能实现精准诊断,资助临床更好地域分差别疾病、施以更恰当治疗。”北京大学第三医院病理科分子病理实验室武睿博士表现,21—三体综合征、新生儿遗传耳聋基因筛查等都是测序技术在临床的良好应用。

可是,对于庞大的、多基因改变引起的疾病,我们尚不能有效地解读患者的生命数据信息。以癌症患者为例,绝大多数突变都具有“个体特异性”,除了个体基因(例如EGFR等),同一个基因在差别患者中能找到相同突变的可能性微乎其微。不外,若从数据出现的网络调控模型来看,特定信号通路上的关键节点基因只管发生了差别突变,但驱动的下游细胞内事件可能是相同的。

现在生物医学专家习惯性地将基因组数据与已有的知识体系举行“核对”(俗称“查字典”)。“虽然这种方式在一定水平上解决了相应问题,但人体的庞大水平绝对是超乎想象的,真的有一本‘字典’可查吗?”哲源科技(中国科学院盘算技术研究所孵化的一家构建生命数据剖析平台的人工智能企业)首席运营官赵宇表现。

“这就需要我们有将生物学、医学相关学科的知识转化为数学模型的能力。”中国科学院盘算技术研究所副研究员、中国科学院盘算技术研究所西部高等技术研究院常务副院长张春明表现,应充实使用现有的生物医学数据,引入系统科学理论和视角,通过设计新的算法挖掘数据之间的关系,为解决现有的问题寻找新的路径。最终,以生物医学大数据推动生物医学研究由原来的假设驱动向数据驱动的方式转变。

算法与算力助力大数据应用

但恒久以来,医生们受循证医学训练,更为强调“可靠”的知识。他们善于收罗大样本的临床数据,并将基础理论的研究与临床履历相联合,最后把临床数据总结成临床诊疗指南与路径。

在精准医疗时代,清华大学人工智能研究院教授杨斌认为,应该在循证医学的基础上,更强调患者个体的个性化诊疗,通过对患者的数据分析并联合临床履历,给出最佳治疗方式。

“传统循证医学以群体证据作为焦点依据,往往无法解释个体差异。而精准医学从基因、情况等个体因素思量疾病在个体的发生生长历程和治疗应答,与仅思量患者共性的传统循证医学相比,能更好地诠释个体差异,更好地提供个体化的药物治疗方案,更宁静、更有效、更合理地设置医疗资源。”中国工程院院士、中国医学科学院北京协和医学院院校长王辰说。

此外,中国工程院院士樊代明也指出,传统的生物医学数据分析思维和方法难以适应大数据分析的需求。生物医学大数据实现了以患者为维度的多源数据的整合,需要分析的数据如此之多,因此不再只依赖分析少量随机抽样的数据,也不再热衷于探求数据之间难以捉摸的“因果关系”,而是更多关注数据的“相关关系”。与传统随机对照研究常用差异性统计分析方法差别,生物医学大数据更多接纳数据模型以及控制混杂的统计分析方法。

那么,即便有了高质量的生物医学大数据,有了相应的算法,就一定能探索出疾病的发生生长纪律么?

谭灼烁给出的谜底是否认的。他表现,光有数据和算法还远远不够,必须要有强有力的算力支持。他举例道,已往单一零星的数据,只需要在普通服务器上用简朴法式处置惩罚和统计就可以;现在是多维海量的大数据,为相识决庞大生物医学问题,要用多维海量的PB级(1PB=106GB)大数据对生命举行建模,那就要设计庞大的算法,而算法的庞大度和盘算量远远凌驾了普通服务器所能处置惩罚的规模,急需高性能的算力资源支撑。

盘算医学扛起数据分析的“大旗”

“基于此,面向人类康健大数据,我们不能简朴地将其明白为需要大规模存储和处置惩罚的数据。大数据的观点有别于统计抽样,它不是凭据小规模抽样观察来推测被视察工具的全貌,而是试图用对该工具的所有丈量数据来描画工具。因此,大数据泛指能全面描画客观工具所有数据的荟萃。”中国科学院盘算技术研究所—哲源图灵达尔文实验室主任牛钢表现。随着数据量呈指数增长,数据更新速度不停加速,精准医学若想早日落地,急需盘算机驱动的临床决议支持系统。

这在谭灼烁看来,势必会发生一门新型交织学科——盘算医学。“它致力于生长定量方法,通过应用数学、工程学和盘算科学来智能化明白人类疾病的机理,并基于工业化的数据、算法、算力及生物医学技术体系为医学服务提供新洞见。”

对此,谭灼烁从四个维度阐释了盘算医学的内在。首先,盘算医学以庞大性系统科学的整体论作为思维方式,去明白生物分子、细胞、组织器官、种群等多个生物层级结构之间相互作用中“涌现”出的新属性,从系统的角度去捕捉疾病发生的机理;其次,盘算医学接纳麋集数据驱动的科学范式,挖掘隐藏于高维、高通量、多维融合的生物医学大数据中的新洞见;再次,盘算医学将生物医学领域的知识模型转换为数学模型,以生物医学大数据作为输入参数,以人工智能算法对模型举行迭代、训练,输出迫近于真实的生命系统结构与功效特征,从而明白疾病发生的本质;最后,盘算医学以高性能盘算为新一代盘算基础设施,为新科学发现提供数据存储、盘算精度和盘算速度上的支撑。

“循证和盘算都是实现精准的技术手段,盘算医学在更高维度上实现了循证。”张春明表现,未来,以基因测序为代表的数据生产一定会迎来免费的时代,数据挖掘成为最终的价值出口,驻足生物医学的科研和工业需求,我们构建了“生命信息引擎”,该引擎归根到底就是面向生命医学数据的盘算机系统,屏蔽了海量数据的治理、明白和盘算等方面的技术细节,让生物医学专家能够便捷地使用信息技术解决行业问题。

文章开头提到的吴双,最后借助“生命信息引擎”给出的数据分析效果,接纳了一种可能的治疗方案。现在,经由这一方案治疗,她的体内已经没有影像可见的肿瘤,血液肿瘤指标也回落至正常水平。

最后,张春明呼吁,生物学家、医学专家和盘算科学家携起手配合富厚盘算医学的内在,以期将疾病的预防、诊断和治疗推向精准。

权威看法

传统的生物医学数据分析思维和方法难以适应大数据分析的需求。生物医学大数据更多接纳数据模型及控制混杂的统计分析方法。

——中国工程院院士樊代明

我们发现的许多新的基因,是关键基因还是“缄默沉静基因”?现在缺乏更广泛和深入的研究。

——中国工程院院士孙燕

由于生物医学数据种类繁多、数据疏散、内部结构高维庞大,大数据分析比其他领域更难题。生物医学领域如果仍只停留在接纳字符串比对、搜索等传统盘算机技术,就难以挖掘生物医学大数据的潜在高价值。

——中国工程院院士李国杰

作为医生,需要转变思想。未来每一个医生都应该熟练应用智能工具处置惩罚海量信息,以寻求越发准确的诊治方案。

——中国工程院院士胡盛寿

随着数据规模的增加,传统的数据模型和数据组织方式已经无法满足海量数据的结构、数量快速增长以及数据结构不停变化的治理需求。

——中国科学院院士贺林

陪同大数据的累积而来的问题是如何将这些数据资源转化为有价值的信息,并指导临床实践。

——中国科学院院士陆林

生命的整体性和疾病的庞大性,使信息化和大数据成为生命科学研究的一定。

——中国工程院院士王红阳

大数据分析正在成为生物医学领域的下一个前沿,将数据存储、共享、分析和质量控制等技术融为一体,能不停为大数据应用工业生长缔造全新机缘。

——中国工程院院士刘昌孝

(张思玮)