본 논문은 대규모 언어 모델(LLM)을 활용하는 AI 에이전트 기반의 현대 소프트웨어 시스템에서 에이전트 동작의 비결정성으로 인해 발생하는 디버깅 및 관찰성 문제를 해결하기 위한 연구를 제시합니다. 자연어 프롬프팅을 통해 에이전트 설정을 정의하는 다양한 프레임워크에서, 에이전트의 동작은 입력에 따라 비결정적이기 때문에 강력한 디버깅 및 관찰 도구가 필수적입니다. 본 논문에서는 에이전트 실행 경로에 대한 프로세스 및 인과적 발견을 활용하여 개발자의 관찰성을 향상시키는 방법을 탐구합니다. 이는 에이전트 동작의 변동성을 모니터링하고 이해하는 데 도움이 됩니다. 또한, 의도된 행동 변화와 의도되지 않은 행동 변화를 구분하기 위해 LLM 기반의 정적 분석 기법을 보완적으로 활용합니다. 이러한 방법을 통해 개발자는 진화하는 사양을 더 잘 제어하고, 더욱 정확하고 명시적인 정의가 필요한 기능적 측면을 식별할 수 있습니다.