Mobile agents는 잠재력이 크지만, 현존하는 기술은 실제 환경에서 장기간의, 여러 애플리케이션에 걸친 작업에서 성공률이 낮다는 한계가 있다. 이는 MLLM 내의 정적이고 내부적인 지식에 과도하게 의존하기 때문이며, 이는 계획 단계에서의 전략적 환각과 UI에서의 작업 실행 오류로 이어진다. 본 논문은 고차원 계획과 저차원 UI 작업에 필요한 지식이 다르다는 점에 착안하여, 이중 레벨 검색 증강을 통합한 새로운 계층적 다중 에이전트 프레임워크인 Mobile-Agent-RAG를 제안한다. 계획 단계에서는 Manager-RAG를 통해 인간이 검증한 포괄적인 작업 계획을 검색하여 전략적 환각을 줄이고, 실행 단계에서는 Operator-RAG를 통해 정확한 원자적 행동에 대한 정밀한 저차원 지침을 검색하여 실행 정확도를 향상시킨다. Mobile-Agent-RAG는 두 개의 특화된 검색 지향 지식 기반을 구축하며, 실제 다중 애플리케이션, 장기간 작업에 대한 에이전트 평가를 위한 Mobile-Eval-RAG 벤치마크를 제시한다. 실험 결과, Mobile-Agent-RAG는 기존 기술 대비 작업 완료율 11.0%, 단계 효율성 10.2% 향상을 보였다.