본 논문은 대규모 언어 모델(LLM)을 기반으로 인간 수준의 인지 능력을 가진 자율 에이전트를 구축하기 위한 새로운 이론적 인지 아키텍처인 통합 마음 모델(Unified Mind Model, UMM)을 제안한다. UMM은 전역 작업 공간 이론을 기반으로 하며, LLM을 활용하여 다중 모달 인지, 계획, 추론, 도구 사용, 학습, 기억, 반성 및 동기 부여와 같은 다양한 인지 능력을 에이전트에게 부여한다. 또한, UMM을 기반으로 사용자가 프로그래밍 없이 도메인/작업 특정 자율 에이전트를 빠르게 생성할 수 있는 에이전트 구축 엔진인 MindOS를 개발했다. LLM의 강점인 의미 이해 및 지시 따르기 능력을 활용하여 인간 수준의 에이전트를 구축하는 이론적 토대를 제시하며, 기존 시도들의 한계를 극복하고자 한다.