Sign In

SGFormer: Spherical Geometry Transformer for 360 Depth Estimation

Created by
  • Haebom
Category
Empty

저자

Junsong Zhang, Zisong Chen, Chunyu Lin, Lang Nie, Zhijie Shen, Kang Liao, Junda Huang, Yao Zhao

개요

본 논문에서는 360도 깊이 추정에서 특히 북극과 남극에서 두드러지는 파노라마 왜곡 문제를 해결하기 위해 구면 기하학 트랜스포머(SGFormer)를 제안합니다. 기존 방법들이 왜곡 제거를 위한 이중 투영 융합 전략이나 전역 구조 포착을 위한 장거리 의존성 모델링을 사용하여 구조가 불명확하거나 지역적 인식이 부족한 문제를 갖는 것과 달리, SGFormer는 구면 기하학적 사전 정보를 비전 트랜스포머에 통합합니다. 구체적으로, 구면 구조의 무결성을 디코딩 중에 유지하기 위해 구면 사전 디코더(SPDecoder)를 사용하여 트랜스포머 디코더를 재구성하고, 양극 재투영, 원형 회전, 곡선 지역 임베딩을 활용하여 각각 등왜곡, 연속성, 표면 거리의 구면 특성을 보존합니다. 또한, 다양한 해상도에서 공간 구조를 보완하기 위해 쿼리 기반 전역 조건 위치 임베딩을 제시하여 공간 위치의 전역적 인식을 높이고 다양한 패치에서 깊이 구조를 선명하게 합니다. 실험 결과, 최첨단 솔루션보다 우수한 성능을 보임을 입증합니다.

시사점, 한계점

시사점:
구면 기하학적 사전 정보를 비전 트랜스포머에 통합하여 360도 깊이 추정에서 파노라마 왜곡 문제를 효과적으로 해결하는 새로운 방법 제시.
SPDecoder를 통해 구면 구조의 무결성을 유지하며 정확한 깊이 추정 성능 향상.
쿼리 기반 전역 조건 위치 임베딩을 통해 다양한 해상도에서 공간 구조를 보완하고 깊이 구조를 개선.
기존 방법들보다 우수한 성능을 다양한 벤치마크 실험을 통해 입증.
한계점:
제안된 방법의 계산 비용 및 복잡도에 대한 분석 부족.
다양한 센서 및 환경에서의 일반화 성능에 대한 추가적인 연구 필요.
특정 유형의 왜곡에 대한 취약성 존재 가능성.
👍