Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Prune4Web: DOM Tree Pruning Programming for Web Agent

Created by
  • Haebom
Category
Empty

저자

Jiayuan Zhang, Kaiquan Chen, Zhihao Lu, Enshen Zhou, Qian Yu, Jing Zhang

개요

본 논문은 대규모 언어 모델(LLM) 기반 웹 에이전트가 복잡한 웹 페이지를 효율적으로 탐색하는 데 직면한 문제를 해결하기 위해, DOM(Document Object Model)을 효율적으로 처리하는 새로운 패러다임인 Prune4Web을 소개합니다. Prune4Web은 LLM이 대규모 DOM을 직접 처리하는 대신, LLM이 생성한 실행 가능한 Python 스크립트를 통해 DOM 요소를 동적으로 필터링하는 'DOM Tree Pruning Programming'을 사용합니다. 이를 통해 정확한 액션 위치 지정을 용이하게 하고, 주의 집중 희석을 완화하며, 최종적으로 웹 자동화 성능을 향상시킵니다.

시사점, 한계점

시사점:
LLM이 대규모 DOM을 직접 처리하는 대신, 프로그램을 통해 DOM을 효율적으로 처리하는 새로운 패러다임을 제시했습니다.
DOM 요소 필터링을 위한 실행 가능한 Python 스크립트를 LLM이 생성하도록 하여, DOM 처리의 효율성을 높였습니다.
실험을 통해 기존 방식 대비 웹 자동화 성능, 특히 낮은 수준의 액션 위치 지정 정확도를 크게 향상시켰습니다.
한계점:
논문에 구체적인 한계점에 대한 언급이 없음.
👍