Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Odyssey: Empowering Minecraft Agents with Open-World Skills

Created by
  • Haebom

저자

Shunyu Liu, Yaoru Li, Kongcheng Zhang, Zhenyu Cui, Wenkai Fang, Yuxuan Zheng, Tongya Zheng, Mingli Song

개요

본 논문은 마인크래프트와 같은 개방형 환경에서 일반적인 에이전트를 구축하는 연구에 대해 다룹니다. 기존 연구는 주로 자원 수집 및 도구 제작과 같은 기본적인 프로그래밍 작업에 초점을 맞추었으나, 본 논문에서는 마인크래프트 세계를 탐험하는 개방형 세계 기술을 LLM 기반 에이전트에 부여하는 Odyssey 프레임워크를 제시합니다. Odyssey는 40개의 기본 기술과 183개의 복합 기술로 구성된 개방형 세계 기술 라이브러리, 마인크래프트 위키에서 파생된 39만 개 이상의 질문-응답 데이터셋으로 미세 조정된 LLaMA-3 모델, 장기 계획, 동적 즉각적 계획, 자율 탐험 작업을 포함하는 새로운 에이전트 성능 벤치마크로 구성됩니다. 실험 결과, Odyssey 프레임워크는 LLM 기반 에이전트의 다양한 기능을 효과적으로 평가할 수 있음을 보여줍니다. 모든 데이터셋, 모델 가중치 및 코드는 공개적으로 제공됩니다.

시사점, 한계점

시사점:
LLM 기반 에이전트의 개방형 세계 탐험을 위한 새로운 프레임워크 Odyssey 제시.
다양한 기술(40개 기본 기술, 183개 복합 기술)을 갖춘 에이전트 구현.
마인크래프트 위키 기반 대규모 질문-응답 데이터셋을 활용한 LLaMA-3 모델 미세 조정.
장기 계획, 동적 즉각적 계획, 자율 탐험 등 다양한 작업을 포함하는 새로운 벤치마크 제시.
모든 자료 공개를 통한 향후 연구 촉진.
한계점:
현재 연구는 기본적인 프로그래밍 작업에 비해 더 복잡하고 다양한 게임 플레이 기회 탐색에 대한 연구가 부족할 수 있음.
Odyssey 프레임워크의 성능은 사용된 LLaMA-3 모델과 데이터셋의 질에 크게 의존하며, 모델의 한계가 프레임워크의 성능을 제한할 수 있음.
제시된 벤치마크가 마인크래프트 환경에 특화되어 다른 개방형 환경으로의 일반화 가능성이 제한적일 수 있음.
👍