대규모 언어 모델(LLM)은 자연어를 SQL로 번역하는 데 뛰어난 성과를 보였지만, 일반적인 지식과 데이터베이스의 도메인별 의미론 사이에는 상당한 간극이 존재합니다. 과거 번역 로그는 이 부족한 도메인 내 지식을 풍부하게 제공하며, SQL 쿼리는 데이터베이스 스키마의 실제 사용 패턴을 내재적으로 캡슐화합니다. 기존 방법론은 개별 번역의 추론 과정을 주로 향상시키지만, 과거 번역에서 도메인 내 지식을 축적하는 데 실패합니다. 본 논문에서는 번역 로그에서 SQL 쿼리를 파싱하여 데이터베이스별 지식 베이스를 구축하는 온라인 자가 진화 프레임워크인 ORANGE를 소개합니다. 스키마 및 데이터 의미론을 포함하는 도메인 내 지식을 축적함으로써, ORANGE는 점진적으로 의미론적 격차를 줄이고 후속 SQL 번역의 정확도를 향상시킵니다. 신뢰성을 보장하기 위해, 튜플 의미론적 추적이 포함된 새로운 중첩된 Chain-of-Thought SQL-to-Text 전략을 제안하여 지식 생성 중 의미론적 오류를 줄입니다. 여러 벤치마크에 대한 실험은 ORANGE의 실용성을 확인하며, 특히 복잡하고 도메인별 쿼리를 처리하는 데 있어 실제 Text-to-SQL 배포에 효과적임을 입증합니다.