Unsupervised Memorability Modeling from Tip-of-the-Tongue Retrieval Queries
Created by
Haebom
Category
Empty
저자
Sree Bhattacharyya, Yaman Kumar Singla, Sudhir Yarram, Somesh Kumar Singh, Harini S I, James Z. Wang
개요
본 논문은 시각 콘텐츠의 기억력 모델링을 위한 대규모 비지도 학습 데이터셋을 소개합니다. 이 데이터셋은 82,000개 이상의 비디오와 설명적 회상 데이터를 포함하며, Reddit과 같은 온라인 플랫폼에서 얻은 tip-of-the-tongue (ToT) 검색 쿼리를 활용합니다. 이 데이터셋을 사용하여 개발된 모델은 회상 생성 및 ToT 검색과 같은 기억력 관련 작업에서 기존 모델보다 우수한 성능을 보입니다.