Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Computer Vision based group activity detection and action spotting

Created by
  • Haebom
Category
Empty

저자

Narthana Sivalingam, Santhirarajah Sivasthigan, Thamayanthi Mahendranathan, G. M. R. I. Godaliyadda, M. P. B. Ekanayake, H. M. V. R. Herath

개요

본 논문은 딥러닝 모델과 그래프 기반 관계 추론을 결합하여 다중 인물 장면에서 그룹 활동을 감지하는 컴퓨터 비전 기반 프레임워크를 제시한다. Mask R-CNN을 사용하여 배우의 위치를 정확하게 파악하고, Inception V3, MobileNet, VGG16과 같은 여러 백본 네트워크를 사용하여 특징 맵을 추출한다. 마스크 정보를 특징 맵과 융합하여 각 배우에 대한 정제된 마스크된 특징 표현을 얻는다. 배우 간의 상호 작용을 모델링하기 위해, 정규화된 상호 상관, 절대 차이의 합, 내적 등을 사용하여 외형 유사성 및 위치 관계를 인코딩하는 배우 관계 그래프를 구성한다. 그래프 컨볼루션 네트워크는 이러한 그래프에서 관계를 추론하고 개별 동작과 그룹 수준 활동을 예측한다. Collective Activity 데이터 세트에 대한 실험 결과는 마스크 기반 특징 개선, 강력한 유사성 검색 및 그래프 신경망 추론의 조합이 혼잡하고 혼잡하지 않은 시나리오 모두에서 향상된 인식 성능을 제공함을 보여준다.

시사점, 한계점

마스크 기반 특징 개선, 강력한 유사성 검색, 그래프 신경망 추론의 통합으로 그룹 활동 인식 성능 향상
개별 동작 및 그룹 수준 활동 모두 예측 가능
Collective Activity 데이터 세트에서 유효성 입증
복잡한 인적 상호 작용, 폐색, 외형 변화에 대한 강건성 확보
다양한 백본 네트워크 활용 및 RoIAlign을 통한 공간 정렬 유지
시각적 정보 외 다른 정보(예: 음성) 미활용 가능성
계산 복잡성 및 처리 속도에 대한 추가 분석 필요
다른 데이터 세트에 대한 일반화 성능 평가 필요
👍