본 논문은 제한적이고 불균형적인 데이터셋으로 인해 성능 저하를 겪는 갑상선 신티그래피 분류를 위한 딥러닝 모델의 성능 향상을 목표로, Stable Diffusion(SD), Flow Matching(FM), 그리고 기존 증강 기법(CA)을 활용한 데이터 증강 기법의 효과를 비교 분석했습니다. ResNet18 분류기를 사용하여 갑상선 질환(확산성 갑상선종, 결절성 갑상선종, 정상, 갑상선염) 분류를 수행한 결과, FM 기반 증강 기법이 SD 기반 기법보다 우수한 성능을 보였으며, 특히 원본 데이터(O)와 CA를 함께 사용한 O+FM+CA 조합이 높은 정확도와 균형 잡힌 분류 성능을 달성했습니다. Wilcoxon 통계 분석을 통해 O+FM 및 O+FM+CA 조합이 SD 기반 증강 기법보다 우수함을 확인했습니다. 이 연구는 FM 기반 증강 기법이 고품질의 합성 갑상선 신티그래피 이미지를 생성하고 의료 영상 분류에서 모델의 일반화 성능을 향상시키는 데 효과적임을 시사합니다.
시사점, 한계점
•
시사점:
◦
Flow Matching 기반 데이터 증강 기법이 갑상선 신티그래피 이미지 분류에서 Stable Diffusion 기반 기법보다 우수한 성능을 보임을 확인했습니다.
◦
원본 데이터와 Flow Matching, 기존 증강 기법을 결합한 O+FM+CA 조합이 높은 정확도와 균형 잡힌 분류 성능을 달성했습니다.
◦
Flow Matching 기반 증강 기법은 고품질 합성 의료 영상 생성 및 모델 일반화 성능 향상에 효과적인 전략임을 제시합니다.
•
한계점:
◦
본 연구는 특정 딥러닝 모델(ResNet18)과 데이터셋에 국한된 결과이며, 다른 모델이나 데이터셋에 대한 일반화 가능성은 추가 연구가 필요합니다.
◦
사용된 데이터셋의 크기 및 불균형 정도에 따라 결과가 달라질 수 있습니다. 더 큰 규모의 균형 잡힌 데이터셋을 사용한 추가 연구가 필요합니다.
◦
다양한 갑상선 질환의 하위 유형에 대한 분석이 부족하여, 질환의 세분화된 분류 성능에 대한 추가 연구가 필요합니다.