본 논문은 멀티모달 대형 언어 모델의 발전을 바탕으로 GUI 자동화 분야에서 중요한 과제인 에피소드적 추론 능력 향상을 위한 History-Aware Reasoning (HAR) 프레임워크를 제안한다. HAR은 에이전트가 단기 기억을 강화하여 긴 호라이즌 GUI 작업을 효율적으로 수행하도록 설계되었으며, 특히 과거 상호 작용을 고려하지 않는 기존 GUI 에이전트의 단점을 보완한다. HAR 프레임워크는 반성적 학습 시나리오 구축, 맞춤형 수정 지침 합성, 하이브리드 강화 학습 보상 함수 설계를 통해 구현된다. 제안된 HAR-GUI-3B 모델은 역사 인식 추론 모드를 채택하여 안정적인 단기 기억과 화면 세부 사항에 대한 정확한 인식을 제공한다. 다양한 GUI 관련 벤치마크에서 제안 방법의 효과와 일반화 성능을 입증했다.