Sign In

MobileViM: A Light-weight and Dimension-independent Vision Mamba for 3D Medical Image Analysis

Created by
  • Haebom
Category
Empty

저자

Wei Dai, Jun Liu

개요

본 논문은 3차원 의료 영상의 효율적인 분할을 위한 새로운 아키텍처인 MobileViM을 제안합니다. 기존 CNN이나 ViT의 높은 계산 비용 문제를 해결하기 위해, 1차원 데이터 처리에 효율적인 Mamba 모델을 기반으로 차원에 독립적인 메커니즘과 양방향 탐색 기법을 도입하였습니다. 또한, 다양한 의료 영상 modality에서 효율성과 정확도를 향상시키기 위한 크로스 스케일 연결 기법을 사용합니다. MobileViM은 NVIDIA RTX 4090 GPU에서 90 FPS 이상의 분할 속도를 달성하여 기존 최첨단 모델보다 24 FPS 이상 빠른 성능을 보이며, PENGWIN, BraTS2024, ATLAS, Toothfairy2 데이터셋에서 각각 92.72%, 86.69%, 80.46%, 77.43%의 Dice 유사도 점수를 달성하여 우수한 성능을 입증합니다.

시사점, 한계점

시사점:
3차원 의료 영상 분할의 속도와 정확도를 크게 향상시키는 새로운 아키텍처 MobileViM을 제시.
기존 모델보다 훨씬 빠른 처리 속도 (90 FPS 이상) 달성.
다양한 의료 영상 데이터셋에서 우수한 성능 (높은 Dice 유사도 점수)을 입증.
Mamba 모델의 의료 영상 분석 분야 적용 가능성을 제시.
한계점:
제시된 모델의 일반화 성능에 대한 추가적인 검증이 필요.
다양한 GPU 환경에서의 성능 평가가 부족.
Mamba 모델을 기반으로 하므로, Mamba 모델 자체의 한계점이 MobileViM에도 영향을 미칠 가능성 존재.
다른 첨단 모델과의 비교 분석이 더욱 심도있게 이루어질 필요가 있음.
👍