본 논문은 GUI 환경에서 여러 상호작용을 통해 작업을 완료하는 GUI 에이전트의 성능 향상을 위한 BacktrackAgent 프레임워크를 제안합니다. 기존 GUI 에이전트는 개별 행동의 정확성 향상에 초점을 맞추고 오류 감지 및 복구 메커니즘이 부족한 한계를 가지고 있습니다. BacktrackAgent는 오류 감지 및 복구를 위한 검증기(verifier), 판단기(judger), 반사기(reflector) 모듈을 포함하는 백트래킹 메커니즘을 도입하여 작업 완료 효율성을 향상시킵니다. 또한, 행동 실행 후 결과 페이지를 고려한 백트래킹 메커니즘을 위한 특별한 훈련 데이터셋을 개발하고, 판단 보상(judgment rewards)을 적용하여 에이전트 성능을 더욱 향상시킵니다. Mobile3M 및 Auto-UI 벤치마크에서 작업 성공률과 단계 정확도 모두 향상된 성능을 보였습니다.