[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Conformal Predictions for Human Action Recognition with Vision-Language Models

Created by
  • Haebom

저자

Bary Tim, Fuchs Clement, Macq Benoit

개요

본 논문은 인간-컴퓨터 협력 시스템에서 비전-언어 모델(VLM) 기반의 인간 행동 인식(HAR) 시스템의 신뢰성을 높이기 위해 Conformal Prediction(CP) 기법을 활용하는 연구입니다. CP를 통해 후보 클래스의 수를 줄여 효율성을 높일 수 있음을 보여주지만, 이로 인해 발생하는 긴 꼬리 분포 문제를 해결하기 위해 추가적인 보정 데이터 없이 소프트맥스 예측의 온도를 조절하는 방법을 제안합니다. 이는 동적인 실세계 환경에서의 다중 모드 인간-AI 상호 작용을 위한 노력에 기여합니다.

시사점, 한계점

시사점:
CP 기법을 통해 VLM 기반 HAR 시스템의 신뢰성 향상 및 효율성 증대 가능성 제시.
소프트맥스 온도 조절을 통한 긴 꼬리 분포 문제 해결 방안 제시.
실세계 동적 환경에서의 다중 모드 인간-AI 상호 작용 연구에 기여.
한계점:
제안된 소프트맥스 온도 조절 방법의 일반화 성능에 대한 추가적인 실험 및 분석 필요.
다양한 VLM 및 HAR 시스템에 대한 적용성 검증 필요.
긴 꼬리 분포 문제에 대한 완벽한 해결책이 아닐 수 있음.
👍