본 논문은 시각 언어 탐색(VLN)에서 최근 대규모 언어 모델(LLM)의 발전에도 불구하고, 고정된 지식 기반과 추론 능력으로 인해 경험적 지식을 완전히 통합하지 못하고 진화 능력이 부족하다는 문제점을 지적합니다. 이를 해결하기 위해 자연 에이전트의 진화 능력에서 영감을 얻어, 테스트 중 지속적으로 진화할 수 있는 자기 진화형 VLN 프레임워크(SE-VLN)를 제안합니다. SE-VLN은 성공 및 실패 사례를 재사용 가능한 지식으로 전환하는 계층적 메모리 모듈, 경험을 검색하고 다단계 의사결정을 가능하게 하는 검색 증강 사고 기반 추론 모듈, 그리고 지속적인 진화를 실현하는 반성 모듈의 세 가지 핵심 모듈로 구성됩니다. R2R 및 REVERSE 데이터셋에서 기존 최첨단 방법보다 각각 23.9% 및 15.0%의 절대 성능 향상을 보이며, 미지의 환경에서 57%와 35.2%의 탐색 성공률을 달성했습니다. 또한, 경험 저장소가 증가함에 따라 성능이 향상되는 것을 보여주어, VLN을 위한 자기 진화형 에이전트 프레임워크로서의 큰 잠재력을 보여줍니다.