Sign In

Can Agent Conquer Web? Exploring the Frontiers of ChatGPT Atlas Agent in Web Games

Created by
  • Haebom
Category
Empty

저자

Jingran Zhang, Ning Li, Justin Cui

개요

OpenAI의 ChatGPT Atlas는 웹 상호 작용 능력을 도입하여 웹 페이지 분석, 사용자 의도 처리, 브라우저 내 커서 및 키보드 입력을 실행할 수 있게 한다. 본 연구는 Google의 T-Rex Runner, Sudoku, Flappy Bird, Stein.world와 같은 브라우저 기반 게임을 테스트 시나리오로 사용하여 Atlas의 웹 상호 작용 능력을 평가한다. Sudoku와 같은 논리적 추론 작업에서는 우수한 성능을 보였지만, 실시간 상호 작용이 필요한 게임에서는 어려움을 겪는 것으로 나타났다.

시사점, 한계점

Atlas는 Sudoku와 같은 논리적 추론 작업에서 인간보다 빠르게 문제를 해결하는 등 뛰어난 성능을 보였다.
Atlas는 정확한 타이밍과 운동 제어가 필요한 실시간 게임에서, 특히 초기 장애물을 넘어서는 데 어려움을 겪었다.
Atlas는 분석적 처리 능력은 뛰어나지만, 실시간 상호 작용이 필요한 동적 웹 환경에서 상당한 제약이 존재한다.
👍