본 논문은 대규모 언어 모델(LLM) 기반 웹 에이전트의 복잡하고 역동적인 웹 환경 탐색 능력 향상을 위한 새로운 프레임워크인 WebSynthesis를 제안합니다. 기존 연구에서 실제 환경 상호작용을 통해 수집된 GUI 트래젝토리를 사용하여 에이전트를 자기 개선하는 방식은 환경 상태의 불안정성과 높은 API 비용 문제를 가지고 있습니다. WebSynthesis는 학습된 월드 모델을 이용하여 가상 웹 환경을 시뮬레이션하고, 효율적이고 가역적인 트리 기반 계획을 통해 다양하고 고품질의 트래젝토리를 대규모로 생성합니다. 이렇게 생성된 데이터를 이용하여 에이전트의 정책을 개선함으로써, 소규모 합성 데이터셋으로 실제 대규모 데이터셋 기반 학습 모델과 비슷하거나 더 나은 성능을 달성할 수 있음을 실험적으로 보여줍니다.