Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Robust 3D-Masked Part-level Editing in 3D Gaussian Splatting with Regularized Score Distillation Sampling

Created by
  • Haebom

저자

Hayeon Kim, Ji Ha Jang, Se Young Chun

개요

본 논문은 Gaussian Splatting 기반 3D 모델의 정밀한 국소 편집을 위한 새로운 프레임워크인 RoMaP를 제안합니다. 기존 방법의 한계인 불일치하는 다중 뷰 2D 파트 분할 및 SDS(Score Distillation Sampling) 손실의 모호성 문제를 해결하기 위해, RoMaP는 3D-Geometry Aware Label Prediction (3D-GALP) 모듈을 통해 정확하고 일관된 파트 분할을 생성하고, 정규화된 SDS 손실 함수와 Scheduled Latent Mixing and Part (SLaMP) 편집 방법을 통해 목표 영역에 대한 정밀한 편집과 문맥적 일관성을 유지합니다. Gaussian prior 제거와 같은 추가 정규화는 기존 문맥을 넘어선 유연한 변형을 가능하게 하고, 강건한 3D 마스킹은 의도하지 않은 편집을 방지합니다. 실험 결과, RoMaP는 재구성 및 생성된 Gaussian 장면과 객체 모두에서 최첨단의 국소 3D 편집 성능을 보여줍니다.

시사점, 한계점

시사점:
Gaussian Splatting 기반 3D 모델의 정밀하고 극적인 부분 편집을 가능하게 함.
3D-GALP 모듈을 통한 정확하고 일관된 다중 뷰 파트 분할 제공.
정규화된 SDS 손실 함수와 SLaMP 편집 방법을 통해 목표 영역에 대한 정밀한 편집과 문맥적 일관성 유지.
기존 문맥을 넘어선 유연한 변형과 의도하지 않은 편집 방지.
재구성 및 생성된 Gaussian 장면과 객체 모두에서 최첨단 성능 달성.
한계점:
3D-GALP 모듈의 성능은 입력 데이터의 질에 의존적일 수 있음.
SLaMP 방법의 효율성은 편집의 복잡성에 따라 달라질 수 있음.
특정 유형의 3D 모델에 대해서는 일반화 성능이 낮을 수 있음.
실험 결과가 특정 데이터셋에 국한되어 일반화 가능성에 대한 추가 연구가 필요함.
👍