Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Hierarchical Prompt Learning for Image- and Text-Based Person Re-Identification

Created by
  • Haebom
Category
Empty

저자

Linhan Zhou, Shuang Li, Neng Dong, Yonghang Tai, Yafei Zhang, Huafeng Li

개요

본 논문은 시각적 쿼리(이미지-이미지, I2I) 또는 텍스트 설명(텍스트-이미지, T2I)을 기반으로 대상 보행자 이미지를 검색하는 것을 목표로 하는 Person re-identification(ReID)을 연구한다. I2I는 차별적인 신원 학습에 중점을 두고, T2I는 정확한 교차 모달 의미 정렬을 요구한다. 기존 방법론들이 두 과제를 별도로 처리하여 표현의 얽힘과 성능 저하를 초래하는 문제를 해결하기 위해, 본 논문은 Hierarchical Prompt Learning (HPL)이라는 통합 프레임워크를 제안한다. HPL은 Task-Routed Transformer와 계층적 프롬프트 생성 방식을 활용하여 I2I와 T2I를 공동으로 최적화한다. 또한 Cross-Modal Prompt Regularization 전략을 통해 프롬프트 토큰 공간에서 의미 정렬을 강화한다. 실험 결과, 여러 ReID 벤치마크에서 SOTA 성능을 달성했다.

시사점, 한계점

시사점:
I2I 및 T2I ReID를 위한 통합 프레임워크를 제시하여, 두 과제의 상호 연관성을 활용.
Task-Routed Transformer 및 계층적 프롬프트 생성 방식을 통해 task-aware 학습을 가능하게 함.
Cross-Modal Prompt Regularization을 통해 의미 정렬을 강화하고 성능 향상.
여러 ReID 벤치마크에서 SOTA 성능을 달성하여 방법론의 효과를 입증.
한계점:
본 논문에서 구체적인 한계점에 대한 언급은 없음.
👍