본 논문은 양자 회로 설계의 어려움을 해결하기 위해 강화 학습과 프로그램 합성을 통합한 새로운 방법인 가젯 강화 학습(GRL)을 제시합니다. GRL은 복합 게이트(가젯)을 행동 공간에 자동으로 생성하고 통합하여 매개변수화된 양자 회로(PQC)의 탐색을 향상시킵니다. 특히, NP-hard 문제인 양자 해밀토니안의 기저 상태 근사와 같은 복잡한 작업에 적용됩니다. 횡단장 Ising 모델을 사용한 실험 결과, GRL은 향상된 정확도, 하드웨어 호환성 및 확장성을 보여주었으며, 제한된 계산 자원 하에서도 문제의 크기와 복잡성이 증가함에 따라 견고한 성능을 유지합니다. 또한, 가젯 추출 기능을 통합하여 특정 하드웨어에 맞춤화된 재사용 가능한 회로 구성 요소를 발견하여 알고리즘 설계와 실제 구현 간의 격차를 해소합니다. 따라서 GRL은 하드웨어 특정 최적화 및 변분 양자 알고리즘에 적용 가능한 양자 회로 최적화를 위한 다목적 프레임워크입니다.