人工智能在乳腺癌的研究

人工智能可以看到乳腺癌在它发生之前

深度学习预测x光检查间隔和screening-detected癌症:case-case-control研究6369年女性

图片作者

要点

使用人工智能(AI)和深度学习(DL)在医学和保健领域h一个以惊人的速度在增加。而健康保险流通与责任法案(HIPAA)对个人健康信息的保护很重要,它的最大障碍收集深度学习所需的大型数据集。成功地实施了几个策略收集大量数据没有冒病人隐私培训医学人工智能系统。AI继续产生重大影响医学成像和深度学习模型不断发展寻找异常如骨折或可能的癌症。

乳腺癌筛查的引入有助于降低女性癌症死亡率以及提供一个一致的图像数据的来源。通常,女性40岁及以上接受x光检查半年度或年度检查任何癌症的迹象。许多发展人工智能检测和部分癌症在乳房x光检查,少开发了基于图像的深度学习模型预测风险。在工作描述中,我们开发了一个模型来预测个体的乳腺癌风险;更具体地说,间隔和筛查检测癌症的风险。

为什么风险很重要?

预测乳腺癌风险类似于预测这是一种与生俱来的困难的问题在各个领域的科学。相比之下,准确地量化病人患癌症的风险比检测更加困难的癌症通过一些诊断测试像乳房x光检查。了解乳腺癌风险和与它相关联的许多因素对癌症预防和监控策略很重要。降低癌症死亡率的最好办法是防止癌细胞在第一时间和准确的风险评估是必不可少的。

有三个临床相关的结果在评估风险在一个人口筛查。这些成果包括筛查出(情况下),间隔(case),或没有(控制)的癌症风险。癌症筛查检测癌症是一种发现,由于一个常规筛查性乳房x光检查。在我们的研究中,我们进一步将它定义为一个癌症发生后12个月内积极筛查性乳房x光检查。间隔之间发现的癌症是一个正常的筛查间隔(一年两次或年度),在我们的研究中定义为一个侵入性癌症后12个月内发生负面的筛查性乳房x光检查。间隔已知癌症生长更迅速和更积极地生物。他们经常发现通过触诊或自我检查。

当前的风险解决方案

盖尔,BRCAPRO Tyrer-Cuzick,乳腺癌监视财团(BCSC)临床风险模型是建立模型的例子。它们都使用不同的组合已知的乳腺癌危险因素包括年龄、身体质量指数(BMI)、和/或乳腺密度。成像技术不能直接用于临床模型通常只用于获得更好的乳房密度的测量。一些图像基于AI模型已经出版展示类似的风险预测的性能。然而,这些人工智能模型约束一个二进制分类,不包括人口筛查中的三种可能的结果。

我们对风险的贡献解决方案

数据集由6369名妇女从梅奥诊所招募,加州大学旧金山。四个标准乳腺视图包括身高,(CC)和中间外侧的斜(枣疯病视图左和右乳房是每个女人。乳腺图像接收他们的原始或“处理”格式之间的像素范围0和2¹⁴。自定义构建软件被用来过滤图像为“提示”格式,放射科医生是用来阅读。重申,所使用的图像是很重要的对我们的风险建模获得癌症诊断之前至少6个月。因此我们使用的图像建模是负面的和没有可见的癌症是由专家放射科医生。

模型开发发生在夏威夷大学癌症中心。一个自我盲目实施占可能过度拟合。数据分为训练和抵抗测试集和测试集从未发送到夏威夷大学。我们进一步将训练集分割成一列火车,验证和测试集对我们的初始模型的发展。一旦我们有信心在我们的建模体系结构和hyperparameters是优化,最终的模型在整个训练集训练。最终的风险模型被送到我们的合作评估合作测试集。这个过程非常kaggle-esque

图1:四个平行网络为每个乳腺视图由作者(图片)

新奇的深度学习模型是使用四个平行的网络来查看所有成像信息同时预测,在图1。除了密度,成像生物标志物的风险勘探,不是很透彻了。虽然癌症发展的一侧乳房,我们怀疑可能存在风险的信号在同侧和对侧的两个乳房。负责的四个网络学习中的信息的四个乳房摄影观点有LCC,碾压混凝土,LMLO, RMLO网络。输出从所有网络汇集,用来制作最终的预测风险。

令人惊讶的结果!

使用一个客观的和其他方法,我们评估风险预测使用接受者操作特征曲线下面积(AUC)。我们的模型执行的AUC 0.66分类控制与一切时,0.63当分类筛查出癌症和其他一切,0.71当分类区间癌症和其他的一切。看到图2。风险建模是一个困难的问题,这些结果相当,如果不是更好,比目前临床风险模型。

图2:最终模型的性能尚未签署的测试集以接受者操作特征曲线下面积(AUC)由作者(图片)

进一步询问可能的风险,成像信号相比我们的人工智能模型性能与条件逻辑回归模型使用常见的临床危险因素。这些危险因素包括临床和自动乳腺影像报告和数据系统(BI-RADS), BMI和密集的体积。自动测量得到使用Volpara临床乳腺密度批准的软件。在癌症筛查检测的情况下,c-statistics改善危险因素与深度学习相结合,所示图3。这个进步表明,深度学习能够选择成像信号相关的风险是正交的或独特的临床危险因素。虽然我们假设它,它仍然是令人惊讶的!在间隔癌症的情况下,深度学习模型无法超越模型建立在乳腺密度。换句话说,乳腺密度仍然是最有力的预测区间罹患癌症的风险。这是更令人惊讶! !乳腺密度是一个危险因素,因为密集的组织可以模糊图像和面具可能的病变。致密的组织也可能掩盖可能的风险和损害我们的人工智能模型信号的性能。

图3:深度学习性能相比对临床危险因素模型由作者(图片)

接下来是什么

理清密度信号远离可能区间癌症风险信号是一个未来可能的研究方向。有更先进的人工智能技术,如对抗的方法,这可能有利于理解乳腺密度之间的相互影响,成像和间隔罹患癌症的风险。夏威夷有更高的晚期癌症发生率相比,其余的美国。机制尚不清楚,但许多假设的独特民族化妆的人发挥作用。我们的成功与深度学习在这个研究给了我们信心,晚期癌症的风险预测是可能的。我们欢迎评论,对话、讨论和协作在这里讨论的话题。可以随意接触并加入到对抗癌症。

继续讨论

最初发表在https://www.lambertleong.com2022年2月5日。

数据科学家,从夏威夷癌症研究员,和创造者

Baidu
map