본 논문은 대규모 언어 모델과 외부 도구, 자율적 계획을 결합한 다중 에이전트 시스템인 에이전트형 인공지능(AI)의 평가 및 모니터링에 관한 연구입니다. 기존 연구에서 제시된 5축 프레임워크와 예비 지표(목표 편향, 피해 감소 등)를 바탕으로, 알고리즘적 구현과 실증적 증거를 제시합니다. 특히, 이종 지표를 정규화하고, 축별 지수 가중 이동 평균 임계값을 적용하며, 마할라노비스 거리를 이용하여 공동 이상 탐지를 수행하는 적응형 다차원 모니터링(AMDM) 알고리즘을 제안하고, 시뮬레이션 및 실제 실험을 통해 알고리즘의 효과성을 검증합니다. AMDM은 이상 탐지 지연 시간을 단축하고, 위양성률을 감소시키는 결과를 보였으며, 관련 코드, 데이터 및 재현성 체크리스트를 공개하여 연구의 재현성을 높였습니다.