背景
原发部位不明的癌症(CUP)是经组织病理学诊断为转移但无法使用常规诊断方法确定其起源的恶性疾病。
这些疾病经常表现为浆液性积液,尽管采用联合化疗,预后却很差。免疫组织化学预测 CUP 最可能的起源;然而,研究人员可以使用免疫染色混合物检测到一些病例。准确识别原发部位对于成功和量身定制的治疗至关重要。
关于该研究
在本研究中,研究人员提出了 TORCH,一种深度学习算法,可根据腹水和胸水的细胞学图片来识别癌症的起源。
研究人员使用四个独立的深度神经网络组合训练模型,产生 12 个不同的模型。研究人员试图利用细胞学图片开发一种基于人工智能的诊断模型,用于预测患有恶性肿瘤、腹水或胸水转移的个体的肿瘤起源。
他们使用来自多个独立测试集的细胞学涂片实例测试并确认了人工智能系统的性能。
2010年6月至2023年10月,研究人员收集了四大机构(郑州大学第一医院、天津医科大学肿瘤医院、烟台毓璜顶医院和苏州大学第一医院)76,183名癌症患者的90,572张细胞学涂片数据作为训练数据。
呼吸系统疾病在恶性疾病中所占比例最高(30%,17,058 名患者)。
癌占腹水和胸水病例的 57%,其中腺癌是最常见的组(47%,27,006 名患者)。仅 0.6% 的鳞状细胞癌转移为腹水或胸腔积液 (n=346)。
为了测试 TORCH 的普遍性和可靠性,研究人员纳入了来自天津肿瘤医院的 4,520 名连续患者(天津-P 数据集)和来自烟台医院的 12,467 名患者(烟台数据集)。
他们从三个内部测试集中随机选择了 496 张细胞学涂片图像,以研究 TORCH 是否可以帮助初级病理学家提高他们的表现。
他们将初级病理学家使用 TORCH 的表现与初级和年长病理学家之前的手动解释结果进行了比较。
研究人员使用注意力热图来解释人工智能模型,该模型在来自三个主要三级转诊医院的患者的 42,682 张细胞学涂片图片中进行癌症检测。该模型利用外部测试数据集在现实场景中进行了评估,其中包括 495 张照片。
该研究旨在提高初级病理学家使用 TORCH 的诊断能力。消融测试评估了将临床特征纳入肿瘤起源预测的优势,并研究了临床因素与细胞学图像之间的关联。
结果
TORCH 模型是一种在癌症诊断和定位中预测肿瘤起源的新技术,已在各种数据集上进行了评估。
研究结果显示,TORCH 的整体微平均单对休息曲线下面积 (AUROC) 读数为 0.97,top-1 准确度为 83%,top-3 准确度为 99%。与病理学家相比,这增强了 TORCH 的预测效率,显着提高了初级病理学家的诊断分数。
初次治疗方法与 TORCH 估计起源一致的原发性未知癌症患者的总体生存率高于接受不一致治疗的患者。该模型表现出相对可靠的泛化性和兼容性。
与五个测试集结合使用时,TORCH 的 top-1 准确度为 83%,top-2 准确度为 96%,top-3 准确度为 99%。它还在低确定性和高确定性组中产生了类似的微平均一对一 AUROC 评级。
该研究纳入了 391 名癌症患者,其中 276 名一致,115 名不一致。随访期结束后,42%的患者死亡,其中一致的患者为37%,不一致的患者为53%。生存分析显示,一致的患者比不一致的患者总体生存率要高得多。
涂片准备不良和图像质量问题(例如切片折叠、污染物或过度染色)可能会导致人工智能对胰腺癌的过度诊断。研究人员可以通过在整个数据筛选步骤中进行细致的手动处理来解决这些缺陷。
就结肠癌而言,粘液占据了图像的大部分区域,这可能导致人工智能模型在做出诊断时忽略了这一关键方面。
结论
根据研究结果,TORCH模型(一种人工智能工具)在临床实践中显示出预测胸腹水恶性细胞的主要系统起源的前景。
它可以区分恶性肿瘤和良性疾病,查明癌症来源,并帮助不明来源癌症患者的临床决策。该模型在五个测试集上表现良好,并且优于四位病理学家。
它可以帮助肿瘤学家为身份不明的 CUP(主要是腺癌)个体选择治疗方案,并接受经验性广谱化疗方案治疗。