Sign In

Manboformer: Learning Gaussian Representations via Spatial-temporal Attention Mechanism

Created by
  • Haebom
Category
Empty

저자

Ziyue Zhao, Qining Qi, Jianfa Ma

개요

본 논문은 자율주행을 위한 3D 의미적 점유 예측 분야에서, 복셀 기반 그리드 예측 대신 3D 가우시안을 사용하는 GaussianFormer를 다룬다. GaussianFormer는 객체 기반의 희소 3D 의미적 가우시안을 사용하여 메모리 요구량을 낮추고, 각 3D 가우시안 함수는 유연한 관심 영역과 그 의미적 특징을 나타낸다. 주의 메커니즘을 통해 이 특징들이 반복적으로 개선된다. 기존 GaussianFormer는 가우시안 함수 크기가 쿼리 해상도보다 커 성능 저하가 발생하는 문제점이 있었기에, 본 연구는 사용되지 않은 시간 정보를 활용하여 GaussianFormer를 최적화한다. 기존 그리드 기반 점유 네트워크에서 공간-시간 자기 주의 메커니즘을 학습하여 GaussianFormer에 적용한다. NuScenes 데이터셋을 사용하여 실험을 진행 중이다.

시사점, 한계점

시사점: 시간 정보 활용을 통해 GaussianFormer의 성능 향상 가능성 제시. 희소 3D 의미적 가우시안 기반의 효율적인 3D 의미적 점유 예측 방법 제안.
한계점: 실험이 진행 중이므로, 최종적인 성능 및 효과에 대한 검증이 필요함. NuScenes 데이터셋에 대한 결과만 제시되어 일반화 가능성에 대한 추가적인 연구가 필요함. 기존 GaussianFormer의 성능 저하 원인에 대한 명확한 분석이 부족함.
👍