科技资讯媒体中国电商报

首页 电商 互联网 硬件 创投 生活

ICLR的卫生保健表示人工智能解决了糟糕的数据和低资源还有黑盒子问题

图灵研究员,剑桥大学和加州大学洛杉矶分校的ML,AI和健康教授,Mihaela van der Schaar认为,在将AI应用于医疗保健时,我们需要一种新的方式来思考“复杂的问题”。“我们需要新的问题表述。Van der Schaar在上周的全数字ICLR 2020会议上的主题演讲(需要登录)中说:“有很多方法可以解决医学上的问题,并且有很多方法可以使这一概念形式化。”

她在AI通常擅长解决的问题和医学领域提出的问题之间做出了区分,尤其是在存在资源限制的情况下。她说:“机器学习已经解决了摆在正确位置上的问题,解决方案的概念是明确定义的,解决方案是可验证的。”例如,ML可以确定图像是猫还是狗,而人可以轻松查看答案。它也擅长于Go之类的游戏,最终有明显的赢家。

她说:“但是医学是不同的。”“问题的提出不恰当,解决方案的概念通常也不明确。解决方案很难验证。”她指出了两个看似相似的癌症患者的例子,他们的结果是不同的,并且随着时间的流逝而不同。她说:“很难理解和验证。”

但是范德沙尔(Van der Schaar)认为,人工智能有巨大的机会积极影响医疗保健。在她的主题演讲中,以及整个会议期间举办的AI for Affordable Healthcare研讨会上,这些问题都以主题出现-数据问题,资源问题以及对AI模型可解释性和人类专业知识的需求。研究人员讨论了解决问题的广泛方式和具体方式。

卫生保健方面的挑战

众所周知,医疗数据存在问题。除了对偏见的标准关注外,各医院之间以及医院与国家之间如何收集,标记,注释和处理医疗数据也存在不一致之处。大量的医学数据以图像的形式出现,例如X射线和CT扫描,并且这些图像的质量可能会因可用的机器而异。健康记录中通常也经常缺少数据。

这与资源稀缺或不可用的问题有关。住在资金雄厚的顶级医院附近的人可能经常对其他医院可以使用的资源和工具有同质(错误)的看法。例如,高端CT扫描仪可以比旧机器或低端机器产生更清晰,更清晰的图像。资源丰富的医院与资源匮乏的医院的医务人员的专业知识可能相差很大,因此,对医学扫描等测试结果的解释取决于图像的质量和查看者。

测试结果和建议的后续措施并没有我们想的那么客观。乳房X线照片上的小白点可能是微钙化-或只是嘈杂图像的伪影。解释该图像的任务需要熟练的临床医生。理想情况下,AI可以提供帮助,尤其是在可用的临床医生没有那么多专业知识的情况下。无论哪种方式,对扫描结果的解释都是一个决定,它会引导患者走上一条道路,他们和他们的医疗保健提供者将做出更多决定,包括治疗和可能的生活方式改变。

对于任何临床医生而言,当然需要AI模型的输出是准确的-但也必须是可解释,可解释和可信赖的。取而代之的是,在可解释性和准确性之间经常要权衡取舍,正确地保持这种平衡至关重要。

Google最近发现了可以在实验室中使用的AI的后果,但是面对这些现实生活中的挑战却在挣扎。

解决方案始于思考“元”

Van der Schaar的使用ML解决这些难题的方法涉及许多特定的技术和模型,但从根本上讲,很多方法都不会使您陷入与一种疾病相关的问题中。她在演讲中说,为每种疾病创建模型效率太低,因此她主张建立一套可以自动实现的自动化ML(AutoML)方法。她说:“我们将让机器学习来完成手工制作。”

在验证了过去使用的几个AutoML模型并解释了每个模型的缺点之后,范德·沙阿尔(Van der Schaar)提出了AutoPrognosis这个工具,她和她的合著者Ahmed M.Alaa在2018年的一篇论文中进行了详细介绍。正如他们所描述的,AutoPrognosis是“针对临床预后量身定制的预测建模管道设计的自动化系统。”这个想法是,临床医生应该尝试使用管道的“集合体”,而不是试图找到一个最佳的预测建模管道。

van der Schaar指出,这是一个复杂且分层的方法,但这还不够,它只能提供预测,但缺乏可解释性。她说:“我们不必只做预测。”“我们需要与之相关的解释。”在ML模型可以转变为可操作的智能之前,临床医生需要大量了解这些模型。

打开黑盒子的包装

Van der Schaar列出了临床医生在对ML模型采取行动或从中采取行动之前需要采取的三项关键工作:透明度,风险理解和避免隐性偏见。

她在可解释性和可解释性之间作了区分。她说:“可解释性是量身定制的可解释性,因为不同的用户寻求不同的理解形式。”例如,临床医生想知道为什么要进行某种治疗,而研究人员则想将假说带到实验室,而患者想知道是否应该改变生活方式。

牛津大学的医生Chris Paton博士在AI for Affordable Healthcare研讨会期间说,对于ML制造商寻求可解释性以了解临床医生的想法很重要。“当临床医生做出决定时,他们通常会在脑海中思考该决定的不同组成部分如何融合在一起。这使他们能够对诊断充满信心,”他说。“因此,如果他们不知道这些参数在一起是什么-[如果]他们只是在屏幕上看到一种报告-他们[对]特定的患者对他们应该有多大的信心将了解甚少。 [诊断]。”

但他还指出,随着患者风险的降低,对可解释性的需求也随之降低。例如,在慢跑时检查一个人的心率与尝试诊断严重疾病相比,其固有的风险要小得多,因为在这种情况下,不准确或误解可能会很严重。

范德沙尔(Van der Schaar)认为,使用称为符号元模型的技术可以使黑匣子模型更易于解释。当然,元模型是模型的模型。这个想法是,您不需要访问黑盒模型。您只需要能够查询输入并确定输出。她说:“符号元模型输出一个透明的函数,用于描述黑匣子模型的预测。”表面上,这消除了在黑盒模型内部进行查看的问题,该模型保留了知识产权,同时还提供了一些可解释性。

克服低或嘈杂的数据

AI for Affordable Healthcare研讨会上的一些演讲重点介绍了克服数据限制的方法,包括不完整或不一致的数据以及嘈杂的数据,尤其是与成像有关的数据。

韩国科学技术研究院(KAIST)助理教授爱德华·崔(Edward Choi)作了题为“电子病历的知识图和表示学习”(EHR)的演讲。目标是将临床医生的健康专业知识(即“领域知识”)与神经网络相结合,以在数据量少的情况下对EHR进行建模。例如,如果一种疾病很少见,那么可能根本没有太多数据。

其他疾病,例如心力衰竭,可以防止其他类型的数据问题。他说:“使[心力衰竭]变得非常困难的是……在中间阶段,提示非常微妙。”他解释说,当心力衰竭的症状很明显并且很容易诊断时,对于患者来说通常为时已晚-发病率已经很高。早期干预是必要的。他说:“关键是尽快进行预测。”

一种方法是纵向跟踪患者的EHR(例如,在一年的过程中),以发现即将发生的心力衰竭的模式和线索。在他的研究中,他使用递归神经网络(RNN)将稀疏表示形式(即患者随时间推移就诊的纵向数据,由EHR中的各种代码表示)转换为紧凑表示形式。最后,输出是1或0,其中1表示患者可能会出现心力衰竭。

他的研究的下一步是一个名为GRAM(基于图的注意力模型)的模型,用于医疗保健表示学习,他和他的合作研究人员创建了该模型以改进上述RNN技术。他们解决的两个主要挑战是数据不足和解释。他说:“为了正确使用RNN或任何大规模的神经网络……您首先需要大量数据。”

他们提出的解决方案是依靠已建立的医学本体,他将其描述为“分层的临床构造和医学概念之间的关系”。它们是疾病分类的分类法,结构像一棵树,带有与该疾病相关的项目分支。图表的底部是“叶子”,即该疾病的五位数代码。(这些代码旨在帮助结算过程。)

这些本体是由领域专家开发的,因此从这个意义上说它们是可靠的。通过查看这些本体中紧密相关的概念,专家可以推断出它们之间的相似知识。例如,如果一种罕见疾病的本体论与一种更常见的疾病相似,则他们可以将知识从一种应用于另一种。

Choi的研究的另一个扩展是图卷积变压器(GCT),他在Google Health期间开发了它。它着眼于EHR没有结构时的处理方式,这与他在GRAM上的工作不同。他说:“当我们开始训练以进行诸如心力衰竭预测之类的有监督的预测测试时,我们假设(医生或医院)就诊中的所有内容都是相互关联的。”他解释说,EHR中的所有内容都会创建一种包含互连节点的图。如果您有一个充实的图表,那么这就是“基本事实”的起点。通过对某些节点缺失数据的患者进行访问,该模型旨在推断出缺失数据以预测结果。

不管是出于监督还是因为数据来自未使用医学编码的国家/地区,医学编码并不一定总是包含在数据中。这是Google软件工程师Constanza Fierro在“以高度非结构化数据预测非计划再入院”论文中与合著者共同应对的挑战的一部分。他们研究了“计划外再次入院”,即患者出院后不到30天意外住院。这些再入院非常重要,因为它们很昂贵,并且可能表明医疗保健质量较差。

“这就是诊所和政府希望有一种方法来预测哪些患者极有可能被再次收治的原因,因此他们可以专注于这些患者-给他们进行随访或随访,以防止再次入院,”他说。 Fierro在研讨会上的演讲中。她说,已经完成了很多工作,深度学习被证明是有用的-但是所有的研究都是在英语数据集和发达国家进行的,主要遵循标准代码和存储的数据。她说:“问题是在诸如智利的发展中国家,没有存储治疗代码,”她补充说,有时仅存储诊断代码,这通常取决于所涉及的医生。

Fierro和她的同事提出了一种深度学习体系结构,该体系结构可以在高度结构化或嘈杂的西班牙语医学数据上获得最新的结果。在论文摘要中,作者声称“我们的模型所获得的结果可与美国医疗中心针对同一任务获得的一些最新结果相媲美。”

“我希望这项工作能够激励其他人测试发展中国家的最新深度学习技术,以便我们能够理解挑战所在,并且我们可以尝试不同的方式来克服这些挑战,” Fierro在研讨会演讲结束时说。

影像学的多重挑战

Choi说,GCT是一种知识图,它通过从完整图中剥离零碎来进行工作-“稀疏化”。一种有点类似的方法,称为IROF,或“功能的迭代删除”,旨在将图像分解为仅AI模型所需的部分,以确保准确性。像Choi的工作一样,IROF的建议优点是双重的:当数据很差(Choi的工作中缺少EHR数据,或者在这种情况下图像模糊)时,有助于提高准确性,还有助于临床医生进行解释。

“在大多数情况下,人类(临床医生)将做出最终诊断,而机器学习模型将仅提供分类以帮助人类进行诊断,”计算机科学博士Laura Rieger说道。丹麦大学的一名学生在Affordable Healthcare AI研讨会上的演讲中。她解释说,尽管有许多现有的评估方法,但是模型通常取决于某些数据类型和数据集,并且视觉检查可能会产生误导。她说,需要采取一种客观的措施来告诉研究人员哪种解释方法适合他们的任务。她说,IROF可以以较低的计算成本和很少的数据提供客观的度量。

该过程从现有数据集和要输入的图像开始。研究人员通过神经网络发送输入(图像)并获得简单,正确的输出。(在她的示例中,Rieger使用了猴子的图片,这很容易被神经网络识别。)他们检查了解释方法,该方法输出黑白图像,其中图像的较亮部分对分类精度高于深色部分。然后,使用计算机视觉,他们可以通过像素和色彩空间对图像进行算法分割。她说:“我可以将这种细分转化为我的解释,并且可以看到我的分类中越来越重要的部分或超像素变得越来越少。”

他们可以深入到分类最重要的超像素,然后将其替换为“平均值”。当他们重新运行测试时,正确分类的可能性下降。然后,他们可以识别图像的第二重要部分,再次应用平均值,然后再次运行。最终,将这些结果显示在图表中,您将获得退化的曲线。

“如果我的解释方法可靠,它将把分类的重要部分识别为重要部分;它们将首先被删除,曲线将快速下降。如果不好,它将首先删除图像中不重要的部分。”她说。

经过多次此类测试后,在图表中添加了许多后续(和类似的)曲线,曲线上的面积为解释方法的质量提供了一个单一的定量值-即IROF得分。里格说,这种方法也适用于医学图像。

电气工程博士Sarah Hooper斯坦福大学的一名学生介绍了旨在帮助临床医生对CT扫描进行分类的工作,即使图像质量较差也是如此。胡珀说,CT扫描广泛应用于医疗保健系统,尤其是对于那些可能显示威胁生命的异常(例如中风或骨折)的头部扫描。

她说:“ ??CT分类法能够自动从正常图像中识别出异常,可以帮助确保迅速看到具有异常图像的患者。”“这类分诊工具在医疗系统中,受过训练的放射科医生较少的情况下可能特别有价值。”

胡珀和她的合著者想创建一个自动的头部CT分诊工具,该工具可以简单地将图像标记为“正常”或“异常”,这是一个嘈杂或有伪影的图像所带来的挑战。胡珀解释说,CT图像扫描的质量在世界许多地方都存在显着差异,到目前为止,在像这样的自动图像分类上所做的大部分工作都使用了“相对同质和高质量”的图像。她的工作重点是使用卷积神经网络(CNN)对一系列质量较低的图像进行图像分类,这些图像通常是质量较低的CT成像系统的结果。

该团队首先从10,000张放射科医生标记的图像数据集开始,然后模拟那些真实图像中的噪声图像,以测试其CNN。他们使用CatSim创建了综合数据集,其中包括临床医生可能在野外看到的嘈杂图像的类型(如有限角度扫描),并在其中训练了模型。

在三种退化图像中的两种(管电流和投影)上,他们发现他们的分类模型效果很好。在重新训练以专注于第三种类型(有限角度扫描)之后,他们的模型在该度量标准上也表现出色。她说:“这似乎有些令人惊讶,因为人眼难以解释有限的角度扫描。”但是,分类所需的信息仍保留在图像中,并且CNN可以找到它。

研讨会上提出的其他成像工作包括自动化3D超声扫描颈动脉斑块,从显微镜图像诊断疟疾,使用AI增强计算机辅助手术中的立体相机信息,利用图像质量转移人工增强MRI图像,改善影像分类。乳腺癌筛查等等。

革命与乐观

从广义上讲,AI研究人员和临床医生所面临的挑战并非特别针对医疗保健-数据质量和可解释性在任何AI工作中都是无处不在的问题-但在医学领域却采用了独特的形式。缺少医疗记录的数据,缺乏罕见疾病的数据,低质量的成像以及需要AI模型与临床过程相吻合的条件,这些都是当生命处于平衡状态时进行诊断和治疗的关键因素。

但是范德沙尔(van der Schaar)持乐观态度,尤其是在AI可以在世界范围内发挥作用方面。在回答问答时的一个问题时,她写道:“我相信ML在获得医疗保健机会有限的国家非常有用。如果功能强大,机器学习方法可以帮助增强(远程)诊断,治疗建议(和第二意见)以及[和]监测。它还可以帮助以个性化方式和低成本有效地监视患者。而且,可以发现谁是治疗/诊断患者的最佳本地专家。”

她在主题演讲结束时说:“如果设计正确,机器学习确实是一个强大的工具-如果正确地解决了问题,并且确定了能够真正为理解这些疾病提供新见解的方法,”她在主题演讲的结尾说道。“当然,我们正处于这场革命的开始,还有很长的路要走。但这是一个令人兴奋的时刻。现在是专注于此类技术的重要时刻。我真的相信机器学习可以为临床医生和医学研究人员[带来新的可能性],并为他们提供强大的新工具,以更好地[护理]患者。”