MedPix 2.0 데이터셋 구축 과정과 활용을 위한 GUI 개발에 대한 논문입니다. 의료 AI 개발의 어려움 중 하나인 고품질 의료 데이터 부족 문제를 해결하기 위해, 기존 MedPix 데이터셋을 기반으로 시각 및 텍스트 데이터를 추출하고, 수동 검증을 거쳐 노이즈를 제거하여 MongoDB 데이터베이스를 구축했습니다. LMM(Large Multimodal Model) 학습 및 미세조정을 위한 원시 데이터 접근을 용이하게 하는 GUI도 함께 개발되었으며, MedPix 2.0을 이용한 CLIP 기반 의료 영상 모달리티 및 위치 분류 모델도 제시되었습니다. GitHub에서 MedPix 2.0 데이터셋을 공개했습니다.