XGeM은 의료 영상에서의 인공지능 활용의 어려움인 데이터 부족, 개인정보 보호 문제, 강력한 다중 모달 통합의 필요성을 해결하기 위해 제안된 67억 매개변수의 다중 모달 생성 모델입니다. 대조 학습을 통해 공유잠재 공간을 구성하고, 임의의 입력 모달리티 하위 집합을 조건으로 할 수 있는 새로운 다중 프롬프트 훈련 전략을 도입하여 다양한 임의의 모달리티 간 합성을 지원합니다. MIMIC-CXR 데이터셋을 사용하여 경쟁 모델들과 비교 평가하고, 전문 방사선과 의사를 대상으로 시각적 튜링 테스트를 통해 생성 데이터의 현실성과 임상적 관련성을 평가하였습니다. 데이터 익명화, 클래스 불균형, 데이터 부족과 같은 의료 데이터 과제를 해결하는 데 활용될 수 있음을 보여줍니다.