본 논문은 대규모 언어 모델(LLM) 기반 텍스트 생성 에이전트의 비용 최적화 문제를 경제학적 관점에서 접근하여 해결 방안을 제시한다. 기존의 토큰당 과금 방식은 도덕적 해이 문제를 야기하는데, 에이전트가 비용 절감을 위해 성능이 낮은 모델을 사용할 유인이 있기 때문이다. 이를 해결하기 위해, 본 논문은 성능 기반의 계약 프레임워크를 제안한다. 이는 에이전트가 비용이 드는 추론 과정을 거쳐 텍스트를 생성하고, 자동화된 품질 평가에 따라 보상이 결정되는 구조이다. 내부 추론 비용이 알려지지 않은 상황에서 기존 계약 이론을 적용할 수 없다는 점을 고려하여, 비용에 대해 강건한(cost-robust) 계약을 제시하고, 이를 통계적 가설 검정 이론과 연결하여 최적 계약의 특징을 규명한다. 실험적으로 다양한 목표 및 LLM 평가 벤치마크에 대한 계약을 도출하여, 비용에 강건한 계약이 비용을 고려하는 계약에 비해 목표 달성 가치에 미치는 영향이 미미함을 보인다.