EditSplat: Multi-View Fusion and Attention-Guided Optimization for View-Consistent 3D Scene Editing with 3D Gaussian Splatting
Created by
Haebom
저자
Dong In Lee, Hyeongcheol Park, Jiyoung Seo, Eunbyung Park, Hyunje Park, Ha Dam Baek, Sangheon Shin, Sangmin Kim, Sangpil Kim
개요
본 논문은 실시간 사용자 친화적인 AR/VR 애플리케이션에서 텍스트 기반 3D 편집의 잠재력을 강조하며, 기존 방법들의 다중 뷰 일관성 부족 문제를 해결하기 위해 EditSplat 프레임워크를 제안합니다. EditSplat은 다중 뷰 융합 안내(MFG)와 어텐션 기반 트리밍(AGT)을 통합하여, 다중 뷰 정보를 확산 과정에 통합하고 3D 가우시안 스플래팅(3DGS)의 효율적인 최적화를 위한 3D 가우시안 선택적 제거 및 최적화를 수행합니다. 이를 통해 텍스트 기반 3D 장면 편집에서 최첨단 성능을 달성합니다.
시사점, 한계점
•
시사점:
◦
텍스트 기반 3D 장면 편집에서 다중 뷰 일관성 문제 해결에 대한 새로운 접근법 제시.
◦
3DGS의 효율적인 최적화를 위한 AGT 기법을 통해 정확하고 의미론적으로 풍부한 국소 편집 가능.
◦
기존 방법들보다 향상된 성능을 보이는 최첨단 텍스트 기반 3D 장면 편집 프레임워크 제시.
•
한계점:
◦
논문에서 구체적인 한계점이나 향후 연구 방향에 대한 언급이 부족함.
◦
제안된 방법의 일반화 성능 및 다양한 3D 모델에 대한 적용 가능성에 대한 추가적인 연구가 필요함.