본 논문은 복잡하고 역동적인 모바일 환경에서 작업 자동화에 필수적인 모바일 에이전트 기술에 대한 종합적인 검토를 제공합니다. 기반 모델의 발전에 따라 실시간 적응 및 다중 모드 데이터 처리가 가능한 에이전트에 대한 요구가 증가하고 있습니다. 본 논문은 실시간 적응성 및 다중 모드 상호 작용을 향상시키는 최근 발전에 초점을 맞춰 모바일 에이전트 기술을 포괄적으로 검토합니다. 최근 개발된 평가 벤치마크는 모바일 작업의 정적 및 상호 작용 환경을 더 잘 포착하여 에이전트 성능에 대한 더 정확한 평가를 제공합니다. 본 논문은 이러한 발전을 프롬프트 기반 방법(LLM을 사용한 지시 기반 작업 실행)과 훈련 기반 방법(모바일 특정 애플리케이션을 위한 다중 모드 모델 미세 조정)의 두 가지 주요 접근 방식으로 분류합니다. 또한 에이전트 성능을 향상시키는 보완 기술을 탐구하고, 주요 과제를 논의하고 미래 연구 방향을 제시함으로써 모바일 에이전트 기술 발전에 대한 귀중한 통찰력을 제공합니다. 자세한 정보는 https://github.com/aialt/awesome-mobile-agents 에서 확인할 수 있습니다.