본 논문은 최신 대규모 언어 모델(LLM)의 추론 능력을 활용하여 도메인 특화 응용 프로그램에 적용하기 위한 다중 에이전트 시스템에 대한 탐색적 연구 결과를 제시합니다. 특히, 여러 개의 전문화된 LLM을 통해 추론 기법, 코드 생성 및 소프트웨어 실행을 결합하는 방법에 초점을 맞춥니다. LLM, 추론 기법 및 응용 프로그램을 개별적으로 평가하는 기존 연구와 달리, 본 논문은 다중 에이전트 LLM 시스템을 위한 명확한 사양을 정의하고, 에이전트 스키마 언어를 도입하여 다중 에이전트 시스템 아키텍처 및 프로토타입을 통해 사양을 실행 및 평가하는 방법을 제시합니다. 사이버 보안 작업을 포함한 테스트 사례를 통해 아키텍처 및 평가 접근 방식의 실현 가능성을 보여주고, OpenAI 및 DeepSeek의 LLM을 사용한 질문 응답, 서버 보안 및 네트워크 보안 작업의 성공적인 완료를 통해 평가 결과를 제시합니다.