본 논문은 자연어 질의를 SQL로 변환하는 Text-to-SQL 시스템의 정확성과 신뢰성 향상에 초점을 맞추고 있습니다. 기존의 자기 수정 기법들은 새로운 오류를 유발하는 경우가 많고, 실행 피드백 기반 방법들은 주로 구문 오류에 집중하여 의미 오류(질의의 논리가 사용자 의도와 일치하지 않는 경우)는 해결하지 못하는 한계를 가지고 있습니다. 본 논문에서는 구조화된 실행 피드백과 훈련된 평가 에이전트를 결합하여 구문 및 의미 오류를 효과적으로 식별하고 수정하는 새로운 방법을 제안합니다. 평가 에이전트는 상세하고 해석 가능한 비평을 제공하며, Spider와 BIRD라는 두 가지 주요 Text-to-SQL 벤치마크에서 유의미한 성능 향상을 보였습니다.