The CASTLE 2024 Dataset: Advancing the Art of Multimodal Understanding
Created by
Haebom
Category
Empty
저자
Luca Rossetto, Werner Bailer, Duc-Tien Dang-Nguyen, Graham Healy, Bjorn {\TH}or Jonsson, Onanong Kongmeesub, Hoang-Bao Le, Stevan Rudinac, Klaus Schoffmann, Florian Spiess, Allie Tran, Minh-Triet Tran, Quang-Linh Tran, Cathal Gurrin
개요
CASTLE 2024 데이터셋은 15개의 시간 정렬된 소스로부터 얻어진 다중 모달 데이터(자기중심 및 타중심 비디오 및 오디오, 기타 센서 스트림 및 보조 데이터)를 포함하는 새로운 에고센트릭 비디오 데이터셋입니다. 4일간 고정된 위치에서 10명의 참가자의 자기중심 시점과 5개의 고정 카메라의 타중심 시점을 포함하여 600시간 이상의 UHD 비디오(50fps)를 기록했습니다. 기존 데이터셋과 달리 얼굴 블러링이나 오디오 왜곡과 같은 부분적 검열이 없습니다. 데이터셋은 https://castle-dataset.github.io/ 에서 이용 가능합니다.