본 논문은 기존 AI 모델의 자율적 행동 및 독립적 추론 능력 부족, 명시적 질의에 의존하는 데이터 입력 방식의 한계를 지적한다. 인간처럼 다양한 영역의 지식을 통합하는 데 어려움을 겪는 AI 에이전트의 문제점을 제기하며, 인간의 사고 과정에서 중요한 역할을 하는 정신적 이미지(Mental Imagery)를 기계 사고 프레임워크에 통합하는 방안을 제시한다. 이를 위해 입력 데이터 유닛, 욕구 유닛, 정신적 이미지 유닛으로 구성된 인지적 사고 유닛을 중심으로 하는 프레임워크를 제안하고, 자연어 문장이나 그림 스케치를 데이터로 활용하여 정보 제공 및 의사결정에 활용하는 방식을 제시한다. 마지막으로, 제안된 프레임워크에 대한 검증 결과를 제시하고 논의한다.