MOSAIC는 방사선 보고서 분류를 위한 다국어, 분류 체계 독립적이며 계산 효율적인 접근 방식입니다. 이는 소형 공개 언어 모델(MedGemma-4B)을 기반으로 구축되었으며, 제로/소수 샷 프롬프팅과 경량 파인 튜닝을 모두 지원합니다. MOSAIC는 영어, 스페인어, 프랑스어, 덴마크어의 7개 데이터 세트에 대해 평가되었으며, 여러 영상 모드 및 레이블 분류 체계를 포함합니다. 5개의 흉부 X-ray 데이터 세트에서 평균 매크로 F1 점수 88점을 달성하여 전문가 수준의 성능에 근접하거나 능가하며, 24GB의 GPU 메모리만 필요합니다. 데이터 증강을 사용하면 덴마크어 보고서에서 80개의 주석 샘플만으로도 가중 F1 점수 82점을 달성할 수 있습니다. 코드와 모델은 오픈 소스입니다.