Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

AirScape: An Aerial Generative World Model with Motion Controllability

Created by
  • Haebom

저자

Baining Zhao, Rongze Tang, Mingyuan Jia, Ziyou Wang, Fanghang Man, Xin Zhang, Yu Shang, Weichen Zhang, Wei Wu, Chen Gao, Xinlei Chen, Yong Li

개요

AirScape는 3차원 공간에서 에이전트가 자신의 움직임 의도를 예측할 수 있도록 설계된 최초의 월드 모델입니다. 현재 시각적 입력과 움직임 의도를 기반으로 미래 관찰 시퀀스를 예측합니다. 11,000개의 비디오-의도 쌍으로 구성된 드론 동작 데이터 세트를 활용하여, 다양한 시나리오에서 드론의 1인칭 시점 비디오와 움직임 의도를 주석 처리했습니다. AirScape는 기초 모델을 훈련하기 위한 두 단계 일정을 개발하여 움직임 의도로 제어 가능하고 물리적 시공간 제약 조건을 준수하는 월드 모델로 만듭니다. 실험 결과는 AirScape가 3D 공간 상상력에서 기존 기초 모델보다 훨씬 뛰어나고, 특히 움직임 정렬 지표에서 50% 이상 향상됨을 보여줍니다.

시사점, 한계점

시사점:
3D 공간 상상력을 위한 새로운 월드 모델 제시.
드론 동작 데이터 세트 구축.
움직임 의도로 제어 가능한 월드 모델 개발.
기존 모델 대비 3D 공간 상상력 성능 향상.
한계점:
논문에 명시된 한계점은 없음.
👍