본 논문은 대규모 언어 모델(LLM)을 기반으로 인간 수준의 인지 능력을 갖춘 자율 에이전트를 구축하기 위한 새로운 이론적 인지 구조인 통합 마음 모델(Unified Mind Model, UMM)을 제안한다. UMM은 전반적 작업 공간 이론을 기반으로 하며, LLM을 활용하여 다중 모달 인지, 계획, 추론, 도구 사용, 학습, 기억, 반성, 동기 부여 등 다양한 인지 능력을 에이전트에게 부여한다. UMM을 기반으로, 프로그래밍 없이 사용자가 도메인/작업 특정 자율 에이전트를 신속하게 생성할 수 있는 에이전트 구축 엔진인 MindOS를 개발하였다. 이는 기존 LLM 기반 에이전트 구축의 이론적 기반 부족 문제를 해결하고자 하는 시도이다.