Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

MTCNET: Multi-task Learning Paradigm for Crowd Count Estimation

Created by
  • Haebom

저자

Abhay Kumar, Nishant Jain, Suraj Tripathi, Chirag Singh, Kamal Krishna

개요

MTCNet이라는 다중 작업 학습(MTL) 기반 심층 신경망 아키텍처를 제안합니다. 이 모델은 군중 밀도 및 개수 추정을 위해 군중 밀도 추정을 주요 작업으로, 군중 개수 그룹 분류를 보조 작업으로 수행합니다. 보조 작업은 주요 작업의 성능 향상을 위해 규모 관련 정보를 포착하는 데 도움이 됩니다. 주요 작업 모델은 특징 추출을 위한 VGG-16 프런트 엔드와 밀도 맵 생성을 위한 확장된 합성곱 신경망으로 구성됩니다. 보조 작업 모델은 주요 작업과 동일한 프런트 엔드를 공유하며, CNN 분류기가 뒤따릅니다. 데이터 증강 없이 ShanghaiTech 데이터셋에서 최첨단 방법보다 5.8% 및 14.9% 낮은 평균 절대 오차(MAE)를 달성하고, UCF_CC_50 데이터셋에서도 10.5% 낮은 MAE로 성능을 능가합니다.

시사점, 한계점

시사점:
다중 작업 학습을 통해 군중 밀도 및 개수 추정 성능 향상.
데이터 증강 없이도 우수한 성능 달성.
ShanghaiTech 및 UCF_CC_50 데이터셋에서 최첨단 성능 기록.
보조 작업을 통한 규모 관련 정보 활용의 효과 입증.
한계점:
제시된 모델의 일반화 성능에 대한 추가적인 검증 필요.
다른 데이터셋이나 다양한 군중 시나리오에 대한 성능 평가 필요.
데이터 증강을 사용하지 않은 결과에 대한 한계 고려.
👍