Text Embedded Swin-UMamba for DeepLesion Segmentation
Created by
Haebom
저자
Ruida Cheng, Tejas Sudharshan Mathai, Pritam Mukherjee, Benjamin Hou, Qingqing Zhu, Zhiyong Lu, Matthew McAuliffe, Ronald M. Summers
개요
본 논문은 CT 영상에서 병변 분할을 통해 만성 질환(예: 림프종)의 임상 평가를 위한 자동 측정을 가능하게 하는 연구에 대해 다룹니다. 방사선학 보고서의 병변 특징에 대한 설명과 영상 특징을 결합하기 위해 대규모 언어 모델(LLM)을 병변 분할 워크플로에 통합하는 가능성을 조사합니다. 공개 데이터셋인 ULS23 DeepLesion과 보고서의 단문 설명을 사용하여 Swin-UMamba 구조에 텍스트를 통합한 Text-Swin-UMamba 모델을 제시합니다. 테스트 데이터셋에서 82%의 높은 Dice Score와 6.58 픽셀의 낮은 Hausdorff distance를 달성하여 기존 방법들(LLM 기반 LanGuideMedSeg, xLSTM-UNet, nnUNet) 보다 성능이 우수함을 보였습니다.
시사점, 한계점
•
시사점:
◦
LLM을 활용한 의료 영상 분할의 효용성을 보여줌.
◦
Text-Swin-UMamba 모델이 기존 모델들 대비 우수한 성능을 달성함 (LLM 기반 LanGuideMedSeg 모델 대비 37% 향상).
◦
방사선학 보고서의 텍스트 정보를 효과적으로 활용하여 의료 영상 분석의 정확도 향상 가능성 제시.