# LOD-Net: Locality-Aware 3D Object Detection Using Multi-Scale Transformer Network

### 저자

Mustaqeem Khan, Aidana Nurakhmetova, Wail Gueaieb, Abdulmotaleb El Saddik

### 💡 개요

본 논문은 3D 포인트 클라우드 데이터의 희소성과 구조적 제약으로 인한 3D 객체 탐지 문제를 해결하기 위해 LOD-Net이라는 새로운 멀티스케일 트랜스포머 네트워크를 제안한다. 제안된 방법론은 로컬 기하학적 정보와 전역적 맥락을 효과적으로 포착하는 멀티스케일 어텐션(MSA) 메커니즘과 고해상도 특징 맵을 생성하는 업샘플링 연산을 통합한다. 이를 통해 LOD-Net은 특히 작거나 의미적으로 연관된 객체를 탐지하는 성능을 향상시켰으며, ScanNetv2 데이터셋에서 mAP@25에서 약 1%, mAP@50에서 4.78%의 성능 향상을 달성했다.

### 🔑 시사점 및 한계

- 3D 포인트 클라우드 데이터에서 로컬 기하학적 특징과 전역적 맥락 정보를 효과적으로 융합하는 멀티스케일 어텐션 메커니즘의 중요성을 입증한다.

- 고해상도 특징 맵을 활용하는 업샘플링 전략이 작은 객체 탐지 성능을 크게 향상시킬 수 있음을 보여준다.

- 경량 모델에 MSA를 적용할 때 업샘플링 전략의 적응성이 성능에 영향을 미침을 분석하며, 향후 경량 모델을 위한 최적화된 업샘플링 방법론 연구가 필요함을 시사한다.

[PDF 보기](https://arxiv.org/pdf/2604.16696)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).
