본 논문은 인간과 같은 방식으로 환경을 이해하고 상호작용하는 에이전트 시스템 개발을 목표로 한다. 기존의 에이전트 시스템이 인간의 기본적인 개념 구조를 제대로 포착하지 못하는 점을 지적하며, 이를 해결하기 위해 구현된 인지 이론과 에이전트 시스템을 연결하는 새로운 프레임워크를 제안한다. 이 프레임워크는 인간 인지 구조의 기반이 되는 반복적인 감각 운동 경험 패턴인 이미지 스키마(image schema)의 형식적 특징을 활용한다. 자연어 설명을 감각 운동 패턴 기반의 형식적 표현으로 변환하도록 대규모 언어 모델(LLM)을 사용자 정의하여, 에이전트의 이해를 기본적인 개념 구조에 기반하도록 하는 신경 상징 시스템을 구축한다. 이는 효율성과 해석 가능성을 향상시키고, 공유된 구현된 이해를 통해 보다 직관적인 인간-에이전트 상호 작용을 가능하게 한다고 주장한다.