본 논문은 대규모 언어 모델(LLM)을 활용한 에이전트 인공지능(AI) 시스템이 복잡한 추론, 계획 및 도구 활용에 상당한 잠재력을 가지고 있음을 보여줍니다. 특히, 자연어 프롬프트만으로 의료 영상 분석을 위한 오픈소스 인지 AI 환경인 SimpleMind(SM)에 LLM 기반 에이전트(OpenManus 사용)를 확장하여 컴퓨터 비전 시스템을 자동으로 구축하는 것을 시연합니다. 에이전트는 사용자의 자연어 프롬프트("provide sm (SimpleMind) config for lungs, heart, and ribs segmentation for cxr (chest x-ray)")를 해석하여, 작업을 분해하고 적절한 도구를 구성하여 SimpleMind 워크플로우 계획(YAML 형식의 도구 구성 파일)을 생성하고, SM-Learn(학습) 및 SM-Think(추론) 스크립트를 자동으로 실행합니다. 50장의 흉부 X선 사진을 사용하여 자동으로 구성, 학습 및 테스트한 결과, 폐, 심장, 갈비뼈에 대한 평균 Dice 점수가 각각 0.96, 0.82, 0.83을 달성했습니다. 이는 데이터 과학자가 수행해왔던 컴퓨터 비전 애플리케이션 개발 과정에서의 자율적 계획 및 도구 구성의 가능성을 보여줍니다.