探索发现 · 交大智慧
上海交大俞章盛团队AI赋能肿瘤进展判别,助力肿瘤临床试验独立阅片
客观缓解率和无进展生存期是抗肿瘤药物II/III期临床试验中常用的结局指标,这些指标的准确性依赖于对药物治疗结果的准确评估。实体瘤疗效评价标准RECIST v1.1是目前用于评估肿瘤疗效反应的指南,其定义了一种根据肿瘤负荷变化评估疗效反应的标准化方法,基于患者在治疗期间定期进行的影像学随访,通过对比随访图像与基线影像中肿瘤的变化,来评估疾病的缓解、稳定及进展情况。
在临床实践中,放射科医生通常需要在三维CT影像序列中识别病变、测量肿瘤负荷和鉴别新发病灶,以此监测药物治疗反应,这是一项极其耗时耗力的工作。此外,阅片主观性可能导致不同放射科医生之间对影像的评估存在差异。有研究显示,两个阅片人之间的不一致率可达23%至46%。不准确的疗效评估可能导致错误的医疗决策,从而影响治疗效果,缩短患者生存时间。不准确的药物治疗结局评估更将造成有效药物未上市或无效药物被上市使用。因此,提升影像评估的标准性和一致性是亟待解决的重要课题。
该研究致力于开发一个基于深度学习的自动化肿瘤进展评估模型。该模型将临床影像医生的评估流程转化为了深度学习模型的工作流程,能够从三维CT影像中首先对肿瘤进行精确分割,随后基于基线及随访影像计算肿瘤的总体负荷变化,并识别新发病灶,最终生成肿瘤进展的评估结果。模型采用多任务学习框架,同时优化肿瘤分割和进展判断的分类任务,并整合医学先验知识及纵向影像之间的关联性,从而提高现有肝肿瘤分割模型在进展判断方面的准确性。
图1. 本研究工作的模式图
图2. 模型准确率验证结果
图3. 模型预测和真实判断的对比
所构建的模型在跨国多中心临床试验队列中进行了五折交叉训练。经过集成的五折模型随后在三个异质性独立外部验证集上进行了评估。独立外部验证集包含了在国际临床试验及实际临床实践中涉及的原发性肝细胞癌、转移性肝细胞癌及混合免疫治疗下的肝癌场景。模型的效能在以下三个方面得到了验证:首先,在基线-随访图像的分析中,模型在三个外部验证队列中的准确率分别达到了0.927、0.982和0.882,显著优于现有肝肿瘤模型的进展判断精度;其次,在患者终点结局层面(即无进展生存期和药物响应时间),模型预测的结局时间与实际结局时间之间的一致性达0.958;最后,在与总生存时间的相关性方面,模型评估的疾病进展状态与患者的总生存时间之间的关联性高于人工判读的疾病进展结果。所开发的模型可用于临床试验中的独立影像阅片,从而降低医生评估的主观性,并促进各医疗中心之间治疗效果评估的一致性。
该研究受到国家自然科学基金、上海市科学技术委员会基金、上海交通大学“医工交叉研究基金”等项目资助。同时感谢上海交通大学网络信息中心提供的超算平台支持。
论文链接:
https://www.nature.com/articles/s41698-024-00754-z