Hier-SLAM: Scaling-up Semantics in SLAM with a Hierarchically Categorical Gaussian Splatting
Created by
Haebom
Category
Empty
저자
Boying Li, Zhixi Cai, Yuan-Fang Li, Ian Reid, Hamid Rezatofighi
개요
Hier-SLAM은 계층적 범주적 표현을 특징으로 하는 새로운 의미론적 3D Gaussian Splatting SLAM 방법론이다. 이는 정확한 전역 3D 의미론적 매핑, 확장성, 그리고 3D 세계에서의 명시적 의미론적 레이블 예측을 가능하게 한다. 기존 의미론적 SLAM 시스템의 매개변수 사용량은 환경의 복잡성이 증가함에 따라 크게 증가하여 장면 이해에 어려움과 비용을 초래한다. 이 문제를 해결하기 위해, 본 논문에서는 대규모 언어 모델(LLM)의 기능을 활용하여 의미 정보를 압축된 형태로 3D Gaussian Splatting에 인코딩하는 새로운 계층적 표현을 제시한다. 또한, 계층적 의미 정보를 계층 내 및 계층 간 최적화를 통해 최적화하도록 설계된 새로운 의미론적 손실 함수를 도입한다. 전체 SLAM 시스템을 향상시켜 추적 및 매핑 성능을 개선한다. Hier-SLAM은 기존의 밀집 SLAM 방법보다 매핑 및 추적 정확도가 우수하며, 2배의 연산 속도 향상을 달성한다. 또한 기존 방법과 비슷한 수준의 의미론적 렌더링 성능을 달성하면서 저장 및 훈련 시간 요구 사항을 크게 줄인다. 의미론적 정보를 포함한 렌더링 FPS는 2,000에 달하고, 의미론적 정보 없이는 3,000에 달한다. 특히 500개 이상의 의미론적 클래스를 갖는 복잡한 실제 환경을 처리하는 기능을 보여주며, 확장성을 강조한다. 오픈소스 코드는 https://github.com/LeeBY68/Hier-SLAM 에서 이용 가능하다.