대규모 언어 모델 기반 에이전트 애플리케이션의 비결정적 동작으로 인한 숨겨진 실행 사이클을 탐지하는 무감독 프레임워크를 제시한다. 이 프레임워크는 구조적 분석과 의미론적 유사성 분석을 결합하여 자원 낭비를 유발하는 비효율성을 찾아낸다. LangGraph 기반 주식 시장 애플리케이션의 1575개 궤적에 대한 평가에서 F1 점수 0.72를 달성하며, 개별 구조적 및 의미론적 방법보다 월등한 성능을 보였다.
시사점, 한계점
•
구조적 분석과 의미론적 분석의 하이브리드 접근 방식을 통해 에이전트 애플리케이션의 비효율적인 사이클을 효과적으로 탐지.
•
LangGraph 기반 애플리케이션에서 높은 F1 점수를 기록하며, 기존 관측 플랫폼의 한계를 극복.