Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

MvKeTR: Chest CT Report Generation with Multi-View Perception and Knowledge Enhancement

Created by
  • Haebom

저자

Xiwei Deng, Xianchun He, Jianfeng Bao, Yudan Zhou, Shuhui Cai, Congbo Cai, Zhong Chen

개요

본 논문은 의료진의 업무 부담을 줄이고 환자 치료를 개선하기 위해 3D CT 영상으로부터 자동으로 진단 보고서를 생성하는 CT 보고서 생성(CTRG) 문제를 다룹니다. 기존 연구들이 다양한 해부학적 관점에서의 진단 정보를 효과적으로 통합하지 못하고 정확하고 신뢰할 수 있는 진단에 필수적인 임상 전문 지식이 부족하다는 한계를 극복하기 위해, 의료진의 진단 과정을 모방하는 새로운 다중 관점 인식 지식 향상 트랜스포머(MvKeTR) 모델을 제안합니다. MvKeTR은 다중 해부학적 관점(axial, coronal, sagittal)에서의 진단 정보를 효과적으로 통합하는 관점 인식 어텐션을 갖는 다중 관점 인식 집계기(MVPA)와, 유사한 보고서를 검색하여 진단 과정에 도메인 지식을 통합하는 교차 모달 지식 향상기(CMKE)로 구성됩니다. 또한, 기존의 MLP 대신 매개변수 효율성이 뛰어나고 스펙트럼 편향이 감소된 Kolmogorov-Arnold Networks (KANs)를 사용하여 고주파 성분을 효과적으로 포착하고 과적합을 완화합니다. 공개 데이터셋 CTRG-Chest-548 K에 대한 광범위한 실험을 통해 제안된 방법이 기존 최첨단 모델들을 대부분의 지표에서 능가함을 보여줍니다. 소스 코드는 GitHub에서 공개됩니다.

시사점, 한계점

시사점:
다중 관점 정보 통합 및 임상 지식 활용을 통해 CT 보고서 생성 성능 향상.
KANs 활용으로 매개변수 효율성 및 과적합 문제 해결.
기존 최첨단 모델 성능을 능가하는 결과 달성.
공개된 소스 코드를 통한 재현성 및 확장성 확보.
한계점:
특정 데이터셋(CTRG-Chest-548 K)에 대한 성능 평가만 제시되어 일반화 성능 검증 필요.
임상 현장 적용을 위한 추가적인 검증 및 안전성 확보 필요.
다른 모달리티(예: MRI, PET) 데이터에 대한 적용 가능성 연구 필요.
👍