본 논문은 대규모 언어 모델(LLM)의 복잡한 지시사항 따르기 능력 향상을 위한 새로운 자동 반복적 개선 프레임워크(AIR)를 제안합니다. 기존 방법들의 한계인 관련성 부족, 확장성 및 다양성 저하 문제를 해결하기 위해, 문서에서 초기 지시사항을 생성하고, LLM을 판단자로 활용하여 모델 출력과 문서를 비교, 귀중한 제약 조건을 통합하는 반복적 개선 과정을 거칩니다. AIR-10K라는 1만 개의 복잡한 지시사항 데이터셋을 구축하여 제안된 방법의 효과를 검증하고, 기존 방법보다 우수한 성능을 보임을 실험적으로 입증합니다.