# ClawEnvKit: Automatic Environment Generation for Claw-Like Agents

### 저자

Xirui Li, Ming Li, Ion Stoica, Cho-Jui Hsieh, Tianyi Zhou

### 💡 개요

집게 모양 에이전트 훈련 및 평가에 필요한 환경 구축은 수동적이고 노동 집약적인 과정으로 확장성이 부족하다는 문제를 해결하기 위해, 본 논문은 자연어 설명을 기반으로 다양한 검증된 환경을 자동으로 생성하는 ClawEnvKit을 제안한다. ClawEnvKit은 자연어 파싱, 환경 명세 생성, 그리고 생성된 환경의 타당성 및 일관성을 검증하는 세 가지 모듈로 구성된다. 이를 통해 1,040개의 환경으로 구성된 Auto-ClawEval 벤치마크를 구축했으며, 이는 인간이 직접 만든 환경 대비 매우 낮은 비용으로 동등하거나 더 나은 성능을 보여주었다.

### 🔑 시사점 및 한계

- **자동화된 환경 생성의 가능성 제시**: 자연어 설명만으로도 복잡하고 검증된 에이전트 환경을 효율적으로 생성할 수 있음을 보여주었다.

- **대규모 벤치마크 구축 및 평가 효율성 증대**: Auto-ClawEval 벤치마크 구축과 이를 통한 에이전트 평가를 통해 기존의 한계를 극복하고 더 정확하고 확장 가능한 평가가 가능해졌다.

- **향후 과제**: 생성된 환경의 다양성 및 복잡성 증진, 다양한 에이전트 아키텍처에 대한 보다 일반적인 적용 가능성 탐색.

[PDF 보기](https://arxiv.org/pdf/2604.18543)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).