Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Taste More, Taste Better: Diverse Data and Strong Model Boost Semi-Supervised Crowd Counting

Created by
  • Haebom
Category
Empty

저자

Maochen Yang, Zekun Li, Jian Zhang, Lei Qi, Yinghuan Shi

개요

본 논문은 고밀도 군중 장면의 높은 주석 비용 문제를 해결하기 위한 반지도 학습 기반 군중 계수 방법인 Taste More Taste Better (TMTB) 프레임워크를 제안합니다. TMTB는 데이터 및 모델 측면 모두를 강조하며, 배경 영역을 채우는 데이터 증강 기법을 통해 데이터 다양성을 높이고, 시각적 상태 공간 모델을 백본으로 사용하여 전역 맥락 정보를 포착합니다. 또한, 정확한 예측을 위한 회귀 헤드와 함께 노이즈에 강건한 분류 헤드를 사용하여 더 정확한 감독을 제공합니다. 네 개의 벤치마크 데이터셋에서 기존 최고 성능을 능가하는 결과를 보였으며, 코드는 공개적으로 제공됩니다.

시사점, 한계점

시사점:
배경 채우기 기반의 효과적인 데이터 증강 기법 제시
시각적 상태 공간 모델을 활용한 전역 맥락 정보 포착
회귀 헤드와 분류 헤드의 결합을 통한 정확도 향상
다양한 난이도의 군중 장면(과밀, 저조도, 악천후)에서 우수한 성능
공개된 코드를 통한 재현성 확보
한계점:
제안된 방법의 일반화 성능에 대한 추가적인 분석 필요
특정 데이터셋에 대한 과적합 가능성 검토 필요
다양한 유형의 노이즈에 대한 robustness에 대한 추가적인 실험 필요
👍