본 논문은 사용자 지시에 기반한 웹 작업 자동화를 위한 유망한 방향으로 떠오르고 있는 웹 에이전트, 특히 최근 발전된 대규모 언어 모델(LLM) 기반 웹 에이전트에 대해 다룹니다. 기존 LLM 기반 웹 에이전트는 사용자의 개인화된 지시 이해 및 맞춤형 작업 실행에 있어 사용자 프로필 및 과거 웹 행동 등의 개인화된 데이터의 중요성을 간과한다는 한계를 지적합니다. 이를 극복하기 위해, 개인화된 데이터와 사용자 지시를 통합하여 지시 이해 및 작업 실행을 개인화하는 LLM 기반 개인화 웹 에이전트 작업을 정의하고, 이를 위한 포괄적인 평가 벤치마크인 PersonalWAB을 제시합니다. PersonalWAB은 사용자 지시, 개인화된 사용자 데이터, 웹 기능 및 두 가지 평가 패러다임을 세 가지 개인화된 웹 작업에 걸쳐 제공합니다. 또한, LLM을 개인화된 웹 에이전트 작업에 적용하기 위한 Personalized User Memory-enhanced Alignment (PUMA) 프레임워크를 제안합니다. PUMA는 작업별 검색 전략을 사용하는 메모리 뱅크를 활용하여 관련 과거 웹 행동을 필터링하고, 이를 기반으로 미세 조정 및 직접 선호도 최적화를 통해 LLM을 개인화된 작업 실행에 맞춥니다. 실험 결과, PUMA가 PersonalWAB에서 기존 웹 에이전트보다 우수함을 보여줍니다.