Nat mac int | 如何基于高维医学影像构建临床可翻译的 AI 系统
原创 风不止步 图灵基因 2021-12-04 07:03
收录于话题#前沿生物大数据分析
撰文:风不止步
IF=15.502
推荐度:⭐⭐⭐⭐⭐
亮点:
文章探讨高维临床成像数据所特有的挑战,强调开发机器学习系统所涉及的一些技术和伦理考虑,这些系统代表许多成像模式的高维性质。此外,作者认为试图解决可解释性、不确定性和偏见的方法应该被视为任何临床机器学习系统的核心组成部分。
2021年11月16日,美国William Hiesinger博士等人在《Nature machine intelligence》上发表了一篇“Designing clinically translatable artificial intelligence systems for high-dimensional medical imaging”的文章,概述了针对高维医学成像机器学习的数据集管理细微差别和架构注意事项,并讨论这些系统中的可解释性、不确定性和偏差,为有兴趣解决构建临床可翻译 AI 系统所带来的一些问题和挑战的研究人员提供模板。
在可预见的未来,高质量的“人工智能就绪”注释医疗数据集的可用性将继续落后于需求。回顾分配临床真实标签需要临床专家投入大量时间,并且在聚合多机构数据以供公开发布方面存在巨大障碍。除了以在硬放射学基本事实标签上训练的模型为特征的“诊断人工智能”之外,还将需要对可能噪声更大的临床复合结果目标进行训练的“疾病预测人工智能”。使用标准化协议进行图像采集和临床真实情况判定的前瞻性数据收集是构建具有配对临床结果的大规模多中心成像数据集的重要步骤。
大型多中心成像数据集会产生大量与文件中嵌入的潜在敏感数据相关的隐私和责任问题。医学数字成像和通信 (DICOM) 标准旨在为医学图像采集、存储和提供工作流程管理,并且几乎被普遍采用。成像文件包含像素数据和相关元数据。许多开源和专有工具可以帮助对 DICOM 文件进行去标识化。后端医院信息学框架还通过“安全列表”支持DICOM 去标识化,这是一种清除可能包含敏感信息的元数据字段的方法。在面向用户的方面,MIRC 临床试验处理器匿名器是一种流行的替代方案,尽管它需要使用某些遗留软件。文档齐全的 Python 包也可用于在使用或传输到合作机构之前处理 DICOM 文件。然后可以提取成像数据并以各种机器可读格式存储。这些数据集很快就会变得庞大而笨拙,虽然对数据存储格式的细节的讨论超出了本视角的范围,但医学成像 AI 的一个关键考虑因素是图像分辨率的保留。
对于涉及 AI 系统与临床医生进行头对头基准测试的研究工作,或在临床注释者的帮助下管理大型数据集,我们建议以 DICOM 格式存储扫描副本。这允许通过可扩展且易于使用的基于云的注释工具进行部署,存在几种用于分配扫描以供临床专家评估的解决方案,要求的范围可能从简单的扫描级别标签到详细的特定于域的解剖分割掩码。另一个优点是扫描保持原始分辨率和质量。实时协作模拟“基于团队”的临床决策,注释和标签可以轻松导出用于下游分析。最重要的是,其中许多工具都可以从任何现代 Web 浏览器远程访问,并且非常易于使用,极大改善用户体验和减轻临床合作者的技术负担。
联合学习等更新的机器学习训练范式可能有助于规避与数据共享相关的许多障碍。尽管在医学成像中已经成功证明,但在将这些方法用于常规临床使用方面仍然存在大量技术挑战。特别是在高维成像机器学习系统的背景下,由于需要从多个参与中心传输和更新训练的权重而引入的网络延迟成为训练更大神经网络的基本速率限制步骤。研究人员还必须确保受训权重的传输在参与机构之间是安全和加密的,这进一步增加了网络延迟。
现代临床机器学习中使用的神经网络架构主要源自那些针对大型照片或视频识别任务进行了优化的架构。在 2018 年美国国立卫生研究院路线图中,缺乏特定于医学成像的架构被认为是一项关键挑战。进一步提出如何训练这些架构在这些系统将如何转化为现实世界方面发挥着重要作用。下一代高维医学成像 AI 将需要对更丰富、上下文更有意义的目标进行训练,而不是简单的分类标签。如今,大多数医学成像 AI 系统都专注于从正常背景诊断少数疾病。典型的方法是在训练这些算法时分配一个数字标签(疾病:1;正常:0)。这与临床受训者学习通过成像扫描诊断不同疾病的方式大不相同。
事件发生时间分析和不确定性量化随着医疗人工智能系统从“诊断”应用转向更多“预后”应用,事件发生时间预测(而不是简单的二元预测)将在临床环境中发现更多相关性。事件时间分析的特点是能够预测作为时间函数的事件概率,而二元分类器只能提供一个预定持续时间的预测。与二元分类器不同,事件时间分析考虑了数据的审查,以允许在观察时间范围内失去跟进或未经历感兴趣事件的个人。生存分析在临床研究中很常见,并且是制定循证实践指南的核心。使用基于图像和视频的机器学习扩展传统的生存模型可以提供对组织切片或医学成像扫描中特征的预后价值的有力洞察。用于时间事件分析的训练视觉网络可能会用于筛查肺癌,有助于根据预期的侵袭性扩散潜力进行风险分层。
然而,从可操作的角度来看,时间到事件的预测可能会被证明是有问题的。在肺癌筛查的假设示例中,胸部计算机断层扫描的可疑结节可能会预测有和没有适当治疗干预的中位生存期。对于临床医生来说,了解机器学习系统对个体患者的预测有多确定可能会很有趣。当不确定一项任务时,人类往往会在谨慎方面犯错。机器学习系统输出是0到1范围内的“类别概率”或“正确的可能性”。然而,当今文献中描述的大多数医学成像机器学习系统都缺乏隐含的表达能力“我不知道”何时提供了超出模型分布的输入数据。即使输入图像是猫的图像,训练用于从计算机断层扫描(例如)预测肺炎的分类器在设计上也被强制提供输出(肺炎或非肺炎)。当人工智能系统部署在与人类用户一起工作的环境中时,不确定性量化的好处出现在项目的转化阶段的后期。许多不确定性量化方法的实现在许可许可下可用,并且与常用的机器学习框架兼容。不确定性量化的结合可能有助于提高高风险医学成像机器学习系统的可解释性和可靠性,并减少自动化偏差的可能性——临床医生可能过度依赖自动化的一种现象。
了解这些机器学习系统如何得出他们的结论对于构建这些系统的工程师和使用它们的临床医生来说都具有相当大的兴趣。显着图和类激活图仍然是解释机器学习算法如何进行预测的事实上的标准。在许多示例中,正确和错误预测的显着图看起来几乎相同。当“疾病”状态和“正常状态”之间的差异需要注意图像或视频的同一区域时,这些缺点更加明显(图 3)。
临床医生应注意,仅靠热图不足以解释 AI 系统的运作方式,在尝试使用可视化(如上图所示)识别故障模式时必须小心。更精细的方法可能涉及连续遮挡测试,其中在有意屏蔽临床医生用于进行诊断或预测的区域之后评估图像的性能。特别是在高维医学成像研究的背景下,激活图可以为视频类成像研究的某些时间阶段的相对重要性提供独特的见解。
机器学习系统学习的功能可能取决于架构设计选择。更重要的是,机器学习系统将根据提供给它的训练数据和目标来学习和延续系统性的不平等。随着医疗保健人工智能系统朝着未来疾病预测的方向发展,必须更加小心地考虑到这些群体在获得医疗保健和结果方面的巨大差异。除了在训练整个 AI 系统时结合结构化数据的输入之外,中间方法还涉及使用黑盒模型训练医学成像神经网络。这可以通过构建“融合网络”来实现,其中表格数据被合并到基于图像或视频的神经网络中,或者其他具有相同基本目标的更高级方法(生成组合的低维表示的自动编码器)数据)。即使没有将人口统计输入纳入高维视觉网络,研究小组通过比较不同性别、种族、地域和收入群体的表现来审核他们的模型也很重要。机器学习系统可能会无意中学会进一步延续和歧视少数民族和有色人种,因此在模型开发过程的早期了解这种偏见至关重要。对机器学习系统的信任对于更广泛的采用至关重要,因为通过显着图和估计特征重要性的模型不可知方法的组合来探索特定特征或变量如何以及为什么会导致预测。另一种方法是在训练逻辑中限制机器学习算法,确保优化步骤发生以控制感兴趣的人口统计变量。这类似于多变量回归模型,其中可以独立于基线人口统计变量研究感兴趣的风险因素的影响。从技术角度来看,这将涉及在训练循环中插入额外的惩罚损失,同时牢记模型性能略低的潜在权衡。有许多开源工具包可以帮助研究人员确定不同变量和输入流(图像预测以及性别和种族等变量)的相对重要性。这些技术可能允许开发更公平的机器学习系统,甚至可以发现没有预料到的隐藏偏见。
教授介绍
William Hiesinger,医学博士
心胸外科助理教授(成人心脏外科)
Hiesinger 博士是董事会认证的、受过奖学金培训的成人心脏外科专家。是斯坦福大学医学院心胸外科的助理教授。其临床重点包括全方位的心胸疾病和治疗方法,例如心脏移植、肺移植、二尖瓣和主动脉瓣修复、心肌病手术治疗和冠状动脉搭桥手术。他担任斯坦福机械循环支持计划的外科主任,领导和指导心室辅助装置 (VAD) 手术植入终末期心力衰竭患者。
美国国立卫生研究院和胸外科基金会已拨款资助 Hiesinger 博士的研究。在斯坦福心胸治疗和外科实验室,研究用于治疗缺血性心力衰竭的生物工程设备、组织工程和血管生成细胞因子疗法等创新。发表大量关于心室辅助装置植入新技术、心力衰竭生命支持进展、心力衰竭细胞移植以及许多其他主题的文章。
目前研究:临床试验Edwards PASCAL CLASP IID/IIF 关键临床试验
参考文献
Rohan Shad, John P. Cunningham et al.Designingclinically translatable artificial intelligence systems for high-dimensionalmedical imaging.(2021)