Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

PromptHash: Affinity-Prompted Collaborative Cross-Modal Learning for Adaptive Hashing Retrieval

Created by
  • Haebom
Category
Empty

저자

Qiang Zou, Shuli Cheng, Jiayi Chen

개요

PromptHash는 효율적인 데이터 검색 및 저장소 최적화를 위한 혁신적인 교차 모달 해싱 프레임워크입니다. 기존 방법들의 의미 보존, 문맥 무결성, 정보 중복성의 한계를 극복하기 위해, 친화성 프롬프트 인식 협업 학습을 활용합니다. 텍스트 친화성 프롬프트 학습 메커니즘, 적응형 게이트 선택 융합 아키텍처(State Space Model과 Transformer 네트워크 결합), 그리고 프롬프트 친화성 정렬 전략(계층적 대조 학습)이라는 세 가지 핵심 기술적 기여를 통해, 모달 간의 의미 일관성을 향상시킵니다. 세 가지 벤치마크 다중 레이블 데이터셋에 대한 종합적인 평가를 통해 기존 방법들보다 상당한 성능 향상을 보였으며, 특히 NUS-WIDE 데이터셋에서 이미지-텍스트 및 텍스트-이미지 검색 작업에서 각각 18.22%와 18.65%의 상당한 성능 향상을 달성했습니다. 코드는 공개적으로 제공됩니다.

시사점, 한계점

시사점:
교차 모달 해싱에서 친화성 프롬프트 인식 협업 학습의 효과를 최초로 입증.
기존 방법보다 향상된 의미 보존, 문맥 무결성, 정보 중복성 문제 해결.
NUS-WIDE 데이터셋에서 이미지-텍스트 및 텍스트-이미지 검색 작업에서 상당한 성능 향상 달성 (각각 18.22%, 18.65%).
공개된 코드를 통해 재현성 및 확장성 확보.
한계점:
제시된 세 가지 벤치마크 데이터셋 외 다른 데이터셋에서의 일반화 성능은 추가 연구가 필요.
프롬프트 엔지니어링에 대한 의존성이 존재하며, 최적의 프롬프트 설계가 성능에 영향을 미칠 수 있음.
계산 비용 및 복잡도에 대한 분석이 부족.
👍