본 논문은 양자 강화 학습(QRL)을 위한 효율적인 훈련 최적화 기법인 Size-Invariant Grid Search (SIGS)를 제안합니다. 이 기법은 양자 회로 시뮬레이션의 시간 및 메모리 제약 문제를 해결하여 최대 350개 노드의 TSP 문제에 대한 Depth-1 Equivariant Quantum Circuit (EQC)의 출력을 시뮬레이션할 수 있게 합니다. SIGS는 기존 강화 학습(RL) 시뮬레이션 대비 시뮬레이션 시간을 96.4% 감소시키면서도, 테스트 세트에서 RL 훈련 모델에 비해 평균 최적성 격차를 0.005 이내로 유지합니다. 또한, SIGS의 이론적 근거로 Size-Invariant Properties를 제시합니다.