Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Complete Gaussian Splats from a Single Image with Denoising Diffusion Models

Created by
  • Haebom

저자

Ziwei Liao, Mohamed Sayed, Steven L. Waslander, Sara Vicente, Daniyar Turmukhambetov, Michael Firman

개요

본 논문은 단일 이미지로부터 가우시안 스플랫을 이용해 완전한 3D 장면을 재구성하는 새로운 방법을 제안합니다. 기존의 가우시안 스플래팅 기법은 밀집된 관측 데이터를 필요로 하며, 폐색되거나 관측되지 않은 영역을 재구성하는 데 어려움을 겪습니다. 본 연구에서는 잠재 확산 모델을 활용하여 단일 이미지만으로도 폐색된 부분을 포함한 완전한 3D 장면을 재구성합니다. 폐색된 영역의 표면을 완성하는 것은 모호성 때문에 어려운 문제인데, 기존 방법들은 단일 "모드"를 예측하는 회귀 기반 방식을 사용하여 흐릿함, 비현실성, 다중 해석 불가능 등의 문제를 야기합니다. 반면, 본 연구에서는 단일 입력 이미지를 조건으로 가우시안 스플랫의 3D 표현 분포를 학습하는 생성적 방식을 제안합니다. 정답 데이터 부족 문제를 해결하기 위해 자기 지도 학습 방식으로 2D 이미지만을 사용하여 잠재 공간을 학습하는 변분 자동 재구성기를 제안하고, 이를 기반으로 확산 모델을 학습합니다. 결과적으로, 본 방법은 충실한 재구성과 다양한 샘플을 생성하며, 고품질의 360도 렌더링을 위해 폐색된 표면을 완성할 수 있습니다.

시사점, 한계점

시사점:
단일 이미지로부터 폐색 영역을 포함한 완전한 3D 장면 재구성 가능
기존 방법의 흐릿함, 비현실성 문제 해결
다양한 가능성을 가진 3D 표현 생성 가능
고품질 360도 렌더링 가능
자기 지도 학습 기반의 효율적인 잠재 공간 학습
한계점:
제안된 Variational AutoReconstructor의 성능에 대한 자세한 분석 부족
실제 복잡한 장면에 대한 일반화 성능 평가 필요
대규모 데이터셋에 대한 확장성 평가 필요
계산 비용 및 처리 시간에 대한 분석 부족
👍