专访《细胞》封面作者张康:AI诊断眼病是这样超越人类的

来源:澎湃新闻

2018-02-26 09:22

“人工智能可以帮助患者更容易、更高效地获得治疗。要相信,现阶段人工智能的作用是辅助医生而非取代医生。”广州妇女儿童医疗中心、加州大学圣地亚哥分校(UCSD)眼科教授张康在接受澎湃新闻专访时如是表示。

《细胞》封面

北京时间2月23日凌晨,张康团队及其合作者在顶级学术期刊《细胞》(Cell)发表封面文章“Identifying Medical Diagnoses and Treatable Diseases by Image-Based Deep Learning”。这项最新研究训练了一个基于“迁移学习”的全新AI诊断工具,可通过视网膜OCT(光学相干断层扫描)图像筛查致盲性视网膜疾病,并能在30秒内决定患者是否需要治疗,准确率可达95%以上。

张康等人不仅试图将眼科医生从庞杂的看片工作中解放,他们还将目标定锁定在全身各系统可以进行图像检测的其他多种疾病。在此番发表的论文中,研究人员就通过将这套AI系统切换到诊断儿童肺炎中来探索其适用性。

结果证明,AI工具不光能鉴别肺炎和正常胸部X线平片,还能区分肺炎的病原体为细菌还是病毒,准确率可达90%以上。“未来我们将继续增加这个系统能够诊断的视网膜疾病,同时还将加入包括肿瘤等的其他系统的疾病。”张康表示。

加州大学圣地亚哥分校(UCSD)眼科教授张康

举一反三的“迁移学习”

在医学领域,人工智能被认为在超越人类专家快速审阅大量医学影像方面极具潜力。然而,人工智能为医学成像提供临床决策的算法在可靠性和可识读性上仍存在挑战。

张康等人在这项研究中,应用的算法则是“迁移学习”(transfer learning algorithm)。论文中指出,目前传统的人工智能算法耗时且昂贵,而“迁移学习”则被认为是一种高效的技术,尤其是面临相对有限的训练数据。

所谓的“迁移学习”,就是把已训练好的模型参数迁移到新的模型来帮助新模型训练,也就是运用已有的知识来学习新的知识,找到已有知识和新知识之间的相似性。张康表示,“这实际上就相当于举一反三。”

张康进一步解释,比如,已经学会下围棋,就可以类比着来学习象棋;会打篮球,就可以类比着来学习排球;已经会中文,就可以类比着来学习英语、日语等等。如何合理地寻找不同模型之间的共性,进而利用这个桥梁来帮助学习新知识,就是“迁移学习”的核心。

相较于其他大多数学习模型的“从零开始”,“迁移学习”先利用卷积神经网络(Convolutional Neural Network,CNN)学习已有的已经标记好的预训练网络系统。

卷积神经网络

以医学图像学习为例,该系统会识别预系统中图像的特点,研究人员再继续导入含有和第一层图像相似参数和结构的网络系统,最终构建出终极层级。

张康等人的系统中,第一级网络是视网膜OCT图像,第二级网络系统使用第一级的图像寻找相应的特点,通过前向传播固定低层图像中的权重,找到已经学习的可辨别的结构,再利用反向传播的方法提取更高层的权重,在其中进行反复的自我调整和反馈、传递,达到学习区分特定类型的图像的目的。

张康表示,“这个模型可以使用极少的训练图像,更快、更高效的辨认图像的特定结构。”

张康还提到,迁移学习能让深度学习变得更加可靠,还能帮我们理解深度学习的模型。比如,我们能够知晓哪部分特征容易迁移,这些特征所对应的是某个领域比较高层、抽象的一些结构型概念。把它们的细节区分开,就能让我们对这个领域的知识表达形成一个更深的理解。

“这样一来,机器就可以像生物的神经系统一样终身学习,不断地对过去的知识进行总结、归纳,让一个系统越学越快,而且在学习过程中还能发现如何学习。”张康认为,“迁移学习”在深度学习上面有极为广阔的应用前景,在图像数据资源有限的医疗领域,更高效、所需图像数量更少的“迁移学习”,可以说是未来5年内AI发展的热点以及深度学习成功应用的驱动力。

致盲性眼病诊断超越人类专家

张康等人将上述“迁移学习” 主要应用于诊断视网膜OCT图像。

视网膜OCT使用光来捕获视网膜的高分辨率体内光学横截面,该截面可以形成活体视网膜组织的三维体积图像。目前,该技术已经成为眼科中最普遍使用的诊断技术之一,每年有近3000万次视网膜OCT图像产生。

论文中指出,目前OCT成像已经在全球范围内成为医生们诊断治疗某些致盲性眼病(年龄相关性黄斑变性(AMD)和糖尿病性黄斑水肿)的一项标准技术。

数据显示,美国有将近1000万人患有AMD,每年还有超过20万人会出现病理性脉络膜新生血管,它也能够引发AMD。另外,近75万名40岁以上的人患有糖尿病性黄斑水肿,这是一种能够影响视力的糖尿病性视网膜病变。研究人员认为,由于人口老龄化和全球糖尿病的流行,上述疾病群体可能会随着时间的推移进一步增加。

幸运的是,目前抗血管内皮生长因子药物在视网膜疾病治疗方面还较为乐观。这也就意味着,如果疾病能被快速准确地诊断出来对患者来说意义重大。

为训练“迁移学习”算法,张康团队首先获取了超过207130张OCT的图像。通过质量初筛后,选取了来自于4686名患者的108312张OCT,包括37206张患有脉络膜新生血管、11349张患有糖尿病性黄斑水肿、8617张患有玻璃膜疣、51140为正常。经历了大量迭代训练后,这款迁移学习算法的精准度最终达到峰值。

随后,研究人员用来自于633名患者共1000张OCT成像图片(上述四类样本每类250张)来测试这一算法模型。

张康对澎湃新闻表示,“我们的AI系统能鉴别脉络膜新生血管、糖尿病黄斑水肿、玻璃膜疣以及正常视网膜的OCT图像,准确率、敏感度、特异度均在95%以上。”

除了用准确率、敏感度、特异度、ROC曲线等来评估其表现,研究团队还将AI诊断结果和6位临床经验丰富的人类专家进行对比。张康认为,“对比得出AI诊断结果与人类相似,甚至准确率更高。”

此外,张康表示,研究中还通过“遮挡测试”得出机器诊断的依据。

AI工具和6位专家诊断结果对比

未来会加入肿瘤诊断

正如张康此前提到的“举一反三”,研究团队并没有将“迁移学习”算法应用局限在眼科方面,他们首先在儿童肺炎诊断方面探索了这套AI系统的普适应。

据世界卫生组织(WHO),肺炎一直是儿童死亡的主要原因。每年全球有200万名5岁以下的儿童死于肺炎,这一数字甚至超过了艾滋病、疟疾和麻疹死亡儿童人数的总和。目前,近95%的新增儿童肺炎案例发生在发展中国家,尤其是东南亚和非洲国家。

而细菌和病毒是儿童肺炎的两大主要罪魁祸首。但这两种不同类型的肺炎要求的治疗应对方式截然不同:细菌性肺炎需要立即用抗生素治疗,病毒性肺炎则主要通过支持性护理来治疗。

正因如此,准确、及时地诊断儿童肺炎的类型至关重要。

研究人员收集了5232张儿童胸部X光片,用于AI系统的训练。其中,3883张和肺炎有关(2538张为细菌性肺炎,1345张为病毒性肺炎),其余1349张为正常。类似的,研究人员随后用来自624名患者的胸部X光片对这一模型进行了测试。

张康表示,“对于肺炎图像,我们的AI工具不光能鉴别肺炎和正常胸部X线平片,还能区分肺炎的病原体为细菌还是病毒,准确率可达90%以上。”

当然,研究人员并没有止步于儿童肺炎诊断。

张康对澎湃新闻表示,“我们的AI系统对于全身各系统可以进行图像检测的疾病都具有适用性,而决定其能否扩展到其他疾病的关键因素是其对于诊断不同的疾病之间的切换的容易度。”

但相比于其他研究,张康认为他们设计的AI系统切换容易度已经有所降低。“在其他的研究中,研究者需要根据不同的疾病设计相应的过滤器,而我们的算法会根据输入的学习图像产生自己的过滤器。另外,我们的‘遮挡测试’也能帮助理解我们的网络系统是如何作出疾病‘判断’的。”

张康提到,在接下来的工作中,研究团队将继续增加这个系统能够诊断的视网膜疾病,同时还将加入包括肿瘤等的其他系统的疾病。

现阶段AI作用是辅助医生而非取代

尽管这套AI系统对于眼病等诊断的准确率已经超越顶级的人类专家,但张康团队设计的初衷仍然是让其“辅助医生”。

张康表示,目前人工智能在医疗领域的应用已非常丰富。包括就诊前疾病的筛查、预防,就诊中医疗图像辅助诊断、检验结果分析、手术辅助,以及就诊后的医疗随访、慢性病监测、康复协助、健康管理,甚至还能用于基础科研辅助、药物研发、基因筛选分析、医疗培训等等,具有极为广阔的发展空间和应用前景。

但就人工智能目前的水平而言,张康认为其最容易被取代的仍然还只是比较单一的、流水线作业式的工作。“要相信,现阶段人工智能的作用是辅助医生而非取代医生。”张康表示,正如人类的工业革命,即使机器终究取代人类的部分工作,发展机器终归是辅助人类、推动人类社会进步里程碑式的进步。

在张康的理解中,未来人工智能将从病人的就医指导、紧急或普通转诊、辅助诊断、个体化治疗等方面,作为辅助临床医生的工具,最大化地利用有限的医疗资源,缓解就诊压力,让病人能更好更及时地获得有效治疗。

张康认为,随着今后医疗资源的自由流动,医院可能更需要人工智能辅助诊断系统。人工智能可以帮助患者更容易、更高效地获得治疗。

而对于此番研究团队开发的这套AI系统,张康希望,这项技术未来能应用到包括初级保健、社区医疗、家庭医生、急诊室等,形成大范围的自动化分诊系统。

(澎湃新闻记者 贺梨萍)

责任编辑:奕含
人工智能 眼科 肺炎
观察者APP,更好阅读体验

他张嘴就来:不寻求与中国贸易战,但中企作弊…

乌克兰暗示西方“双标”,美欧:你们和以色列不一样

美国对中国造船业等发起301调查,商务部:一错再错

“令人鼓舞!无法想象没有中国的全球供应链”

德最大反对党也来华:德国危机,中国紧盯