본 논문은 3차원 의료 영상의 효율적인 분할을 위한 새로운 아키텍처인 MobileViM을 제안합니다. 기존의 CNN이나 ViT와 같은 방법들이 3차원 의료 영상 분석에 계산 비용이 많이 드는 문제점을 갖는다는 점을 지적하며, Mamba 모델의 장점을 활용하여 차원에 독립적인 메커니즘과 양방향 탐색 기법을 도입했습니다. 또한, 다양한 의료 영상 모달리티에서 효율성과 정확도를 향상시키기 위해 크로스-스케일 브리징 기법을 사용합니다. 결과적으로 MobileViM은 NVIDIA RTX 4090 GPU에서 90 FPS 이상의 속도를 달성하여 기존 최첨단 모델보다 24 FPS 이상 빠른 성능을 보였으며, 다양한 데이터셋에서 높은 Dice 유사도 점수를 기록했습니다.