본 논문은 시각 언어 모델(VLMs)을 활용한 로봇 계획, 특히 장기간에 걸친 작업을 위한 적응적 다중 에이전트 계획 프레임워크 REMAC을 제안한다. REMAC은 환경에 대한 사전 지식이나 세심하게 설계된 작업별 프롬프트에 의존하지 않고, 자기 반성 및 자기 진화 모듈을 통해 동적인 환경 변화에도 효율적이고 장면에 구애받지 않는 다중 로봇 장기 계획 및 실행을 가능하게 한다. 자기 반성 모듈은 진행 상황을 평가하고 계획을 개선하며, 자기 진화 모듈은 장면 특유의 추론에 기반하여 계획을 동적으로 조정한다. RoboCasa 기반의 다중 에이전트 환경에서 다양한 작업에 대한 실험을 통해 REMAC이 기존 방법들보다 성공률을 40%, 실행 효율을 52.7% 향상시키는 것을 보여준다.