본 논문은 대규모 언어 모델(LLM) 기반 진화적 탐색을 강화 학습(RL)로 개선하여 복잡한 문제에 대한 효율적인 알고리즘 발견을 가속화하는 방법을 제시합니다. 기존의 LLM 기반 진화적 탐색이 LLM을 정적 생성기로만 사용하는 것과 달리, 본 논문에서는 진화적 탐색 과정에서 얻은 신호를 이용하여 LLM(탐색 연산자)을 지속적으로 RL 미세 조정을 통해 개선합니다. 이를 통해 진화적 탐색은 개선된 알고리즘을 발견하는 탐색 전략으로, RL은 이러한 발견에 기반하여 LLM 정책을 최적화하는 역할을 수행합니다. 빈 패킹, 외판원 문제, 플랫팩 문제 등 세 가지 조합 최적화 문제에 대한 실험 결과, RL과 진화적 탐색을 결합하면 개선된 알고리즘 발견 효율이 향상됨을 보여줍니다.