본 논문은 대규모 언어 모델과 같은 파운데이션 모델이 생성한 "합성" 출력을 경험적 연구 및 의사 결정에 활용하는 것에 대한 연구를 제시한다. 모델이 생성한 출력은 실제 관측치가 아닌, 모델의 학습 패턴과 사용자의 주관적인 사전 지식, 기대, 편향을 반영하는 파운데이션 사전 지식에서 비롯된다고 주장한다. 이 논문은 합성 데이터의 의존성을 사용자 예상 데이터 분포, 프롬프트 엔지니어링 프로세스, 파운데이션 모델에 대한 신뢰에 명시적으로 모델링한다. 파운데이션 사전 지식을 사용자의 기본 사전 지식에 대한 지수 가중, 일반화된 베이즈 업데이트로 도출하고, 신뢰 매개변수를 통해 합성 데이터에 할당된 가중치를 제어한다. 또한, 합성 데이터와 파운데이션 사전 지식을 표준 통계 및 계량 경제학적 작업 흐름에 통합하는 방법을 제시하며, 복잡한 모델 개선, 잠재적 구성 요소 정보 제공, 실험 설계 안내, 무작위 계수 및 부분 선형 사양 보강 등 다양한 응용 분야에서의 활용을 논의한다.