OceanGym은 해양 수중 환경에서 에이전트의 발전을 위해 설계된 최초의 포괄적인 벤치마크입니다. 시야가 낮고, 역동적인 해류와 같은 극심한 인식 및 의사 결정 문제점을 제시하는 수중 환경에서 효과적인 에이전트 배포는 매우 어렵습니다. OceanGym은 8개의 현실적인 작업 도메인과 다중 모드 대형 언어 모델(MLLM)에 의해 구동되는 통합 에이전트 프레임워크를 포함합니다. 에이전트는 광학 및 음파 데이터를 이해하고, 복잡한 환경을 자율적으로 탐색하며, 이러한 극한 조건에서 장기간의 목표를 달성해야 합니다.
시사점, 한계점
•
해양 수중 환경에서 강력한 임베디드 AI 개발을 위한 테스트베드를 제공합니다.
•
MLLM 기반 에이전트와 인간 전문가 간의 상당한 격차를 보여주며, 인지, 계획 및 적응성의 어려움을 강조합니다.
•
실제 자율 해양 수중 차량에 이러한 기능을 이전하여 지구의 마지막 미개척 지역 중 하나에서 작동할 수 있는 지능형 에이전트 개발을 위한 중요한 단계입니다.