Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

SimWorld: An Open-ended Realistic Simulator for Autonomous Agents in Physical and Social Worlds

Created by
  • Haebom
Category
Empty

저자

Jiawei Ren, Yan Zhuang, Xiaokang Ye, Lingjun Mao, Xuhong He, Jianzhi Shen, Mrinaal Dogra, Yiming Liang, Ruixuan Zhang, Tianai Yue, Yiqing Yang, Eric Liu, Ryan Wu, Kevin Benavente, Rajiv Mandya Nagaraju, Muhammad Faayez, Xiyan Zhang, Dhruv Vivek Sharma, Xianrui Zhong, Ziqiao Ma, Tianmin Shu, Zhiting Hu, Lianhui Qin

개요

SimWorld는 복잡한 물리적, 사회적 환경에서 LLM/VLM 에이전트를 개발하고 평가하기 위해 Unreal Engine 5를 기반으로 구축된 새로운 시뮬레이터입니다. 현실적인 물리 및 사회 역학, 언어 기반 절차적 환경 생성 기능을 제공하며, 다양한 수준의 추상화된 멀티모달 입력 및 개방형 어휘 동작을 통해 LLM/VLM 에이전트를 위한 풍부한 인터페이스를 제공합니다. 또한, 사용자가 쉽게 사용자 정의할 수 있는 다양하고 확장 가능한 물리적 및 사회적 추론 시나리오를 지원합니다. GPT-4o, Gemini-2.5-Flash, Claude-3.5, DeepSeek-Prover-V2와 같은 LLM 에이전트를 사용하여 전략적 협력 및 경쟁이 필요한 장기적인 멀티 에이전트 배달 작업을 시연하며, 모델 간의 뚜렷한 추론 패턴과 한계를 보여줍니다. SimWorld는 오픈 소스로 제공됩니다.

시사점, 한계점

시사점:
현실적인 환경에서 LLM/VLM 에이전트의 개발과 평가를 위한 새로운 플랫폼 제공.
정확한 물리, 사회 역학 및 언어 기반 환경 생성을 통해 현실적인 시뮬레이션 환경 구축.
다양한 LLM/VLM 에이전트의 성능 비교 및 분석 가능.
오픈 소스 플랫폼으로, 연구 및 개발의 접근성 향상.
한계점:
구체적인 한계점에 대한 논문 내 언급 없음. (하지만, 논문의 범위는 "심층적인 분석"을 제공하지 않고, 시뮬레이터의 소개 및 초기 결과에 초점을 맞추고 있을 가능성이 높음.)
구체적인 모델의 한계점은 제시되었으나, SimWorld 자체의 기술적 한계점은 명시되지 않음.
👍