新的人工智能工具“TORCH”成功识别未知原发病例的癌症起源

在《自然医学》最近发表的一项研究中，研究人员开发了一种利用细胞学组织学 (TORCH) 进行肿瘤起源分化的深度学习方法，利用 57,220 名患者的细胞学图片识别胸水和腹水中的恶性肿瘤并预测肿瘤起源。

背景

原发部位不明的癌症（CUP）是经组织病理学诊断为转移但无法使用常规诊断方法确定其起源的恶性疾病。

这些疾病经常表现为浆液性积液，尽管采用联合化疗，预后却很差。免疫组织化学预测 CUP 最可能的起源；然而，研究人员可以使用免疫染色混合物检测到一些病例。准确识别原发部位对于成功和量身定制的治疗至关重要。

关于该研究

在本研究中，研究人员提出了 TORCH，一种深度学习算法，可根据腹水和胸水的细胞学图片来识别癌症的起源。

研究人员使用四个独立的深度神经网络组合训练模型，产生 12 个不同的模型。研究人员试图利用细胞学图片开发一种基于人工智能的诊断模型，用于预测患有恶性肿瘤、腹水或胸水转移的个体的肿瘤起源。

他们使用来自多个独立测试集的细胞学涂片实例测试并确认了人工智能系统的性能。

2010年6月至2023年10月，研究人员收集了四大机构（郑州大学第一医院、天津医科大学肿瘤医院、烟台毓璜顶医院和苏州大学第一医院）76,183名癌症患者的90,572张细胞学涂片数据作为训练数据。

呼吸系统疾病在恶性疾病中所占比例最高（30%，17,058 名患者）。

癌占腹水和胸水病例的 57%，其中腺癌是最常见的组（47%，27,006 名患者）。仅 0.6% 的鳞状细胞癌转移为腹水或胸腔积液 (n=346)。
为了测试 TORCH 的普遍性和可靠性，研究人员纳入了来自天津肿瘤医院的 4,520 名连续患者（天津-P 数据集）和来自烟台医院的 12,467 名患者（烟台数据集）。

他们从三个内部测试集中随机选择了 496 张细胞学涂片图像，以研究 TORCH 是否可以帮助初级病理学家提高他们的表现。

他们将初级病理学家使用 TORCH 的表现与初级和年长病理学家之前的手动解释结果进行了比较。

研究人员使用注意力热图来解释人工智能模型，该模型在来自三个主要三级转诊医院的患者的 42,682 张细胞学涂片图片中进行癌症检测。该模型利用外部测试数据集在现实场景中进行了评估，其中包括 495 张照片。

该研究旨在提高初级病理学家使用 TORCH 的诊断能力。消融测试评估了将临床特征纳入肿瘤起源预测的优势，并研究了临床因素与细胞学图像之间的关联。