Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Panoramic Distortion-Aware Tokenization for Person Detection and Localization in Overhead Fisheye Images

Created by
  • Haebom
Category
Empty

저자

Nobuhiko Wakai, Satoshi Sato, Yasunori Ishii, Takayoshi Yamashita

개요

천장 어안 렌즈 이미지에서 사람 감지는 사람 회전과 작은 사람으로 인해 어렵습니다. 기존 연구는 주로 사람 회전을 해결했지만, 작은 사람 문제는 충분히 탐구되지 않았습니다. 본 논문에서는 회전을 처리하기 위해 어안 렌즈 이미지를 정방형 파노라마로 재매핑하고, 파노라마 기하학을 활용하여 작은 사람을 보다 효과적으로 처리합니다. 기존 감지 방법은 주의 맵에서 더 큰 사람을 선호하여 작은 사람을 놓치는 경향이 있습니다. 반구형 정방형 파노라마에서 이미지 상단 근처의 수직 각도에 따라 사람의 겉보기 높이가 거의 선형적으로 감소한다는 것을 발견했습니다. 이러한 발견을 바탕으로, 작은 사람 감지를 향상시키기 위해 파노라마 왜곡 인식 토큰화를 도입했습니다. 이 토큰화 절차는 간격 없이 최적의 분할을 가능하게 하는 자기 유사 도형을 사용하여 파노라마 특징을 분할하고, 작은 사람의 중요 영역을 보존하기 위해 토큰 그룹의 각 타일에서 최대 중요도 값을 활용합니다. 파노라마 이미지 재매핑과 토큰화 절차를 결합한 transformer 기반의 사람 감지 및 위치 추정 방법을 제안하며, 대규모 데이터셋에서 기존 방법보다 우수한 성능을 보였습니다.

시사점, 한계점

시사점:
어안 렌즈 이미지에서 사람 감지의 어려움을 해결하기 위한 새로운 접근 방식 제시 (파노라마 이미지 재매핑 및 토큰화).
작은 사람 감지 성능을 향상시키기 위한 파노라마 왜곡 인식 토큰화 기법 개발.
Transformer 기반의 사람 감지 및 위치 추정 방법을 제안하고, 대규모 데이터셋에서 기존 방법보다 우수한 성능 입증.
한계점:
논문에 구체적인 한계점에 대한 언급이 없음. (Abstract 내용만 존재)
👍