본 논문은 단일 이미지로부터 완전한 3D 장면을 재구성하는 새로운 방법인 FlashDreamer를 제시합니다. 기존의 3D Gaussian Splatting 기법은 최적의 성능을 위해 다중 관점에서 캡처된 이미지에 의존하지만, FlashDreamer는 사전 훈련된 비전-언어 모델을 활용하여 장면에 대한 설명적인 프롬프트를 생성하고, 확산 모델을 통해 다양한 관점에서 이미지를 생성하여 이를 융합하여 일관된 3D 재구성을 수행합니다. 다중 이미지 입력의 필요성을 크게 줄여 단일 이미지 입력으로부터 포괄적인 3D 장면을 효과적이고 견고하게 확장합니다. 추가적인 훈련 없이 단안 3D 재구성 기능을 확장합니다.