谷歌AI再获突破 看一眼就知道哪个肺癌基因突变

新浪科技
2018-09-20

分享本文至∇

新浪科技2018-09-20

近日,《Nature Medicine》上发表了一项重磅研究:来自纽约大学医学院的研究人员开发了一个新的机器学习程序,不仅能够以97%的准确率确定患者的肺癌类型,甚至还可以识别导致异常细胞生长的变异基因!

肺癌是生存率最低的癌症之一,据统计,在美国每年有超过15万人死于与疾病相关的并发症。更让人沮丧的是,在过去四十年中,尽管癌症患者的总生存率提高了2倍多,但肺癌患者的生存率几乎没有提高。目前仅有5%的肺癌患者生存期超过10年。在肺癌的诊断和治疗方面,人们还有很长的路要走。

研究人员团队使用了来自Google的深度卷积神经网络Inception v3,并使用来自The Cancer Genome Atlas(TCGA)数据集的1634张图像对其进行了重新训练。TCGA是一个由美国国家癌症研究所(NCI)和美国国家人类基因组研究所(National Human Genome Research Institute,NHGRI)维护的公共数据集,包含了33种不同类型的癌症,以及每种癌症中存在的基因组变化数据。

 两种肺癌类型的示意图
▲上图为AI模型从癌变组织图像中识别两种肺癌类型的示意图。其中左图为原始图像,右图为AI输出的肺癌类型图谱。右图中的红色部分为鳞状细胞癌,蓝色部分为肺鳞状细胞癌,灰色部分为正常肺部组织(图片来源:NYU School of Medicine)

在完成了对Inception v3的训练之后,研究人员开始使用该神经网络,来区分腺癌(LUAD)和鳞状细胞癌(LUSC),这两种癌症都是肺癌最常见的形式。结果显示,尽管样本中出现了在之前训练中从未出现的特征,比如血块、炎症、坏死区域和肺萎缩等等,Inception v3仍然可以正确识别绝大部分样本中的肺癌类型,正确率最高可到达97%。更加令人印象深刻的是,该模型在一台拥有单一图形处理器的电脑上运行时,平均计算时间只需短短20秒。

有趣的是,研究人员发现,在被AI程序错误分类的那一小部分肿瘤图像中,约有一半也被病理学家错误地进行了分类,这一点表明了区分两种肺癌类型的难度。另一方面,在54幅被至少一位病理学家分类错误的图像中,机器学习正确识别出了其中45幅的癌症类型,这一点说明人工智能可以为医生提供有用的补充信息。

除了对疾病类型的识别外,研究人员还训练Inception v3识别癌变组织内的突变基因。利用肿瘤外观的细微差异,AI模型可以预测在细胞中是否存在与肺癌相关的6个突变基因,这6个基因分别为STK11、EGFRFAT1SETBP1KRASTP53。针对不同的突变基因,Inception v3的预测准确率也不同,总体介于73%到86%之间。

“总的来说,这项研究表明深度卷积神经网络可能会成为一个非常有用的工具,帮助病理学家对肺部组织图像进行分类,”研究人员在论文中写道:“有了这些至关重要的信息,就可以为肺癌患者量身定制适合他们的靶向疗法,从而增加精准治疗的范围和效果。”

 纽约大学Langone’s Perlmutter Cancer Center病理系副教授Aristotelis Tsirigos博士
▲该研究的通讯作者之一、纽约大学Langone’s Perlmutter Cancer Center病理系副教授Aristotelis Tsirigos博士

“推迟癌症治疗永远不会对患者有益,”该研究的通讯作者之一、纽约大学Langone’s Perlmutter Cancer Center病理系副教授Aristotelis Tsirigos博士表示:“我们的研究提供了强有力的证据,表明机器学习能够即时确定癌症亚型和基因突变特征,有助于让患者更早开始接受靶向治疗。”

未来,研究团队计划继续对该AI程序进行进一步的数据培训,使其能够以超过90%的准确率确定哪些基因在特定癌症中发生突变。届时他们将会申请将该技术用于临床,来辅助进行不同癌症类型的诊断工作。

Copyright © 西子客浙ICP备:13051348-2