본 논문은 대규모 언어 모델과 레이아웃 제어 확산 모델을 결합하여 예술적인 무대를 생성하는 최초의 포괄적인 프레임워크인 StageDesigner를 소개합니다. StageDesigner는 무대 미술의 전문적인 요구사항을 고려하여 노련한 아티스트의 작업 과정을 시뮬레이션하여 몰입형 3D 무대 장면을 생성합니다. 세 가지 주요 모듈(각본 분석, 전경 생성, 배경 생성)로 구성되어 있으며, 각본 분석 모듈은 입력 각본에서 주제 및 공간적 단서를 추출하고, 전경 생성 모듈은 필수적인 3D 객체를 구성하고 배치하며, 배경 생성 모듈은 서사적 분위기에 맞는 조화로운 배경을 생성하고 전경과 배경 요소 간의 폐색을 관리하여 공간적 일관성을 유지합니다. 또한, 다양한 역사적 스타일을 포괄하고 각본, 이미지, 상세한 3D 레이아웃으로 주석이 달린 276개의 고유한 무대 장면으로 구성된 전용 데이터셋인 StagePro-V1을 소개합니다. 표준 및 새롭게 제안된 지표를 사용한 평가와 광범위한 사용자 연구를 통해 StageDesigner의 효과를 입증합니다.