본 논문은 알고리즘을 연산 토큰의 시퀀스로 표현하고, 강화 학습으로 안내되는 앙상블 몬테카를로 트리 탐색(MCTS)을 사용하여 새로운 알고리즘을 자동으로 발견하는 프레임워크를 제시합니다. 이 프레임워크는 문법을 이용하여 토큰을 연결하여 점점 더 정교한 절차를 형성하고, 새로운 토큰을 생성합니다. 결과적으로, 강한 NP-hard 조합 최적화 문제와 Grover 알고리즘 및 양자 근사 최적화 알고리즘과 같은 기본적인 양자 컴퓨팅 접근 방식에 대해 기존 방법보다 훨씬 성능이 뛰어난 새로운 알고리즘을 재발견, 개선 및 생성합니다. 코드 생성 수준이 아닌 계산 수준에서 작동하여 문제 인스턴스에 특별히 맞춤화된 알고리즘을 생성합니다.