본 논문은 다양한 애플리케이션 도메인에서 분석을 발전시키는 데 필수적인, 표 형태, 텍스트, 시각적 입력 또는 출력을 포함하는 다중 모드 데이터를 이용한 정확한 예측에 초점을 맞추고 있습니다. 기존 접근 방식은 종종 높은 예측 정확도를 유지하면서 이질적인 데이터 유형을 통합하는 데 어려움을 겪습니다. 본 논문에서는 조건부 확산 모델과 같은 다중 모드 합성 데이터 생성을 활용하여 구조화되고 비구조화된 모드에서 예측 성능을 향상시키는 새로운 프레임워크인 Generative Distribution Prediction (GDP)을 제시합니다. GDP는 모델에 종속되지 않으며, 고충실도 생성 모델과 호환되고, 도메인 적응을 위한 전이 학습을 지원합니다. 본 논문은 확산 모델을 생성 백본으로 사용할 때 예측 정확도에 대한 통계적 보장을 제공하여 GDP에 대한 엄격한 이론적 기반을 마련합니다. 데이터 생성 분포를 추정하고 위험 최소화를 위한 다양한 손실 함수에 적응함으로써 GDP는 다중 모드 설정에서 정확한 점 예측을 가능하게 합니다. 표 데이터 예측, 질문 답변, 이미지 캡션 생성 및 적응형 분위수 회귀라는 네 가지 지도 학습 작업에 대한 실험적 검증을 통해 다양한 도메인에서 GDP의 다양성과 효과를 보여줍니다.