Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

OpenHands: An Open Platform for AI Software Developers as Generalist Agents

Created by
  • Haebom

저자

Xingyao Wang, Boxuan Li, Yufan Song, Frank F. Xu, Xiangru Tang, Mingchen Zhuge, Jiayi Pan, Yueqi Song, Bowen Li, Jaskirat Singh, Hoang H. Tran, Fuqiang Li, Ren Ma, Mingzhang Zheng, Bill Qian, Yanjun Shao, Niklas Muennighoff, Yizhe Zhang, Binyuan Hui, Junyang Lin, Robert Brennan, Hao Peng, Heng Ji, Graham Neubig

개요

OpenHands (이전 명칭: OpenDevin) 플랫폼은 인간 개발자처럼 코드 작성, 명령줄 상호작용, 웹 브라우징을 통해 환경과 상호 작용하는 강력하고 유연한 AI 에이전트 개발을 위한 플랫폼입니다. 해당 논문에서는 플랫폼의 새로운 에이전트 구현 방법, 코드 실행을 위한 샌드박스 환경과의 안전한 상호 작용, 여러 에이전트 간의 조정, 평가 벤치마크 통합 방법을 설명합니다. 소프트웨어 엔지니어링(예: SWE-BENCH) 및 웹 브라우징(예: WEBARENA)을 포함한 15가지 까다로운 작업에 대한 에이전트 평가를 수행하고, MIT 라이선스 하에 공개된 오픈소스 프로젝트로 188명 이상의 기여자로부터 2,100개 이상의 기여가 있었습니다.

시사점, 한계점

시사점:
인간 개발자처럼 다양한 방식으로 환경과 상호작용하는 AI 에이전트 개발을 위한 강력한 플랫폼 제공
코드 실행을 위한 안전한 샌드박스 환경 제공으로 안전성 향상
다양한 작업(소프트웨어 엔지니어링, 웹 브라우징 등)에 대한 에이전트 성능 평가 기준 마련
오픈소스로 공개되어 활발한 커뮤니티 기반 개발 가능
한계점:
논문에서 제시된 15가지 작업 외 다른 유형의 작업에 대한 에이전트 성능은 추가적인 연구가 필요
샌드박스 환경의 안전성에 대한 보다 엄격한 검증 필요
플랫폼의 확장성 및 다양한 에이전트 유형에 대한 적용 가능성에 대한 추가적인 연구 필요
👍