MedVAE: Efficient Automated Interpretation of Medical Images with Large-Scale Generalizable Autoencoders
Created by
Haebom
저자
Maya Varma, Ashwin Kumar, Rogier van der Sluijs, Sophie Ostmeier, Louis Blankemeier, Pierre Chambon, Christian Bluethgen, Jip Prince, Curtis Langlotz, Akshay Chaudhari
개요
본 논문은 의료 영상의 고해상도와 광시야로 인한 딥러닝 모델 학습의 높은 계산 비용 문제를 해결하기 위해, 의학적으로 중요한 특징을 유지하면서 영상 크기를 줄이는 방법을 제시합니다. MedVAE라는 6개의 대규모 2D 및 3D 오토인코더를 도입하여 의료 영상을 축소된 잠재 표현으로 인코딩하고, 다시 고해상도 영상으로 디코딩하는 기술을 개발했습니다. 1,052,730개의 의료 영상을 사용하여 2단계 학습 방식으로 MedVAE를 학습시켰으며, 20개의 의료 영상 데이터셋에서 다양한 작업을 통해 고해상도 영상 대신 MedVAE 잠재 표현을 사용하여 downstream 모델을 학습시키면 처리량이 최대 70배까지 향상될 수 있으며, 동시에 임상적으로 중요한 특징이 유지됨을 보여줍니다. 또한 MedVAE가 잠재 표현을 고해상도 영상으로 높은 충실도로 디코딩할 수 있음을 증명했습니다. 결론적으로, 대규모 일반화 가능한 오토인코더가 의료 분야의 중요한 효율성 문제를 해결하는 데 도움이 될 수 있음을 보여줍니다. 코드는 https://github.com/StanfordMIMI/MedVAE 에서 확인할 수 있습니다.