DALL-M은 의료 영상 진단의 정확성을 높이기 위해 설계된 새로운 프레임워크입니다. 기존의 흉부 X선 영상만으로는 질병 진단에 부족한 정보를 보완하기 위해, 환자의 활력징후, 방사선학적 소견, 인구통계학적 요인 등의 구조화된 임상 데이터와 방사선학 보고서 및 의학 지식베이스(Radiopaedia, Wikipedia 등)에서 추출한 정보를 결합하여 문맥에 맞는 합성 데이터를 생성합니다. 대규모 언어 모델(LLM)을 활용하여 기존 임상 특징에 대한 합성 값을 생성하고, 새로운 임상 관련 특징을 추가합니다. MIMIC-IV 데이터셋(799 케이스)에 적용한 결과, 기존 9개의 임상 특징을 91개로 확장하여 다양한 머신러닝 모델(Decision Trees, Random Forests, XGBoost, TabNET)의 성능을 향상시켰습니다. (F1 score 16.5%, Precision 및 Recall 25% 증가). 데이터 무결성을 유지하면서 예측 모델링 성능을 향상시키는 확장 가능하고 실용적인 접근 방식을 제시합니다.