Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

UniHOI: Unified Human-Object Interaction Understanding via Unified Token Space

Created by
  • Haebom
Category
Empty

저자

Panqi Yang, Haodong Jing, Nanning Zheng, Yongqiang Ma

개요

인간-객체 상호작용(HOI) 분야에서 탐지 및 생성은 전통적으로 개별적으로 다루어져 상호작용 이해의 발전을 저해했습니다. 이를 해결하기 위해, UniHOI는 통합된 토큰 공간을 통해 HOI 탐지 및 생성을 공동으로 모델링하여 지식 공유를 촉진하고 일반화를 향상시킵니다. 특히, 대칭적인 상호작용 인식 주의 모듈과 통합된 반지도 학습 패러다임을 도입하여 제한된 주석 환경에서도 이미지와 상호작용 의미론 간의 효과적인 양방향 매핑을 가능하게 합니다. 실험 결과, UniHOI는 HOI 탐지 및 생성 모두에서 최첨단 성능을 달성했습니다. UniHOI는 롱테일 HOI 탐지 정확도를 4.9% 향상시켰고, 개방형 어휘 생성 작업에서 상호작용 메트릭을 42.0% 향상시켰습니다.

시사점, 한계점

HOI 탐지 및 생성의 통합 모델링을 통해 지식 공유 및 일반화 능력 향상
대칭적인 상호작용 인식 주의 모듈 및 통합된 반지도 학습 패러다임 도입
롱테일 HOI 탐지 및 개방형 어휘 생성 작업에서 우수한 성능 달성
제한된 주석 환경에서의 효과적인 양방향 매핑 가능
논문의 한계점은 명시되지 않음
👍