Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

IndEgo: A Dataset of Industrial Scenarios and Collaborative Work for Egocentric Assistants

Created by
  • Haebom
Category
Empty

저자

Vivek Chavan, Yasmina Imgrund, Tung Dao, Sanwantri Bai, Bosong Wang, Ze Lu, Oliver Heimann, Jorg Kruger

개요

본 논문은 조립/분해, 물류 및 정리, 검사 및 수리, 목공 등 일반적인 산업 작업을 다루는 다중 모드 에고센트릭 및 엑소센트릭 데이터 세트인 IndEgo를 소개합니다. 이 데이터 세트는 3,460개의 에고센트릭 녹화 (약 197시간)와 1,092개의 엑소센트릭 녹화 (약 97시간)를 포함합니다. 데이터 세트의 핵심 초점은 두 명의 작업자가 인지적 및 육체적으로 강렬한 작업을 공동으로 수행하는 협업 작업입니다. 에고센트릭 녹화에는 풍부한 다중 모드 데이터와 시선, 내레이션, 사운드, 동작 등을 통한 추가 컨텍스트가 포함됩니다. 자세한 주석 (작업, 요약, 실수 주석, 내레이션), 메타데이터, 처리된 출력 (시선, 손 자세, 반밀도 포인트 클라우드) 및 절차적 및 비절차적 작업 이해, 실수 감지 및 추론 기반 질의 응답에 대한 벤치마크를 제공합니다. 실수 감지, 질의 응답 및 협업 작업 이해에 대한 기본 평가를 통해 데이터 세트가 최첨단 다중 모드 모델에 도전 과제를 제시함을 알 수 있습니다.

시사점, 한계점

산업 작업에 특화된 다중 모드 에고센트릭 및 엑소센트릭 데이터 세트 제공.
협업 작업에 초점을 맞춰 실제 산업 환경에서 발생하는 복잡한 상호 작용 연구 가능.
다양한 주석 및 처리된 출력 제공으로 광범위한 연구 기회 제공.
Mistake Detection, Question Answering, collaborative task understanding에 대한 벤치마크 제공.
최첨단 모델에게도 어려운 과제를 제시하여 연구 발전을 촉진.
데이터 세트 구축에 필요한 자원 (시간, 비용, 인력)이 많이 소요되었을 것으로 예상.
데이터 세트의 산업적 특성으로 인해 특정 분야에 대한 일반화의 한계 존재 가능.
실험 환경 및 작업자 간의 차이로 인해 결과의 재현성이 제한될 수 있음.
👍