본 논문은 Q-학습 알고리즘의 하이퍼파라미터 튜닝을 위한 새로운 방법인 QF-tuner를 제안합니다. QF-tuner는 FOX 최적화 알고리즘을 사용하여 보상을 우선시하는 새로운 목적 함수를 통해 하이퍼파라미터를 자동으로 조정합니다. OpenAI Gym의 CartPole과 FrozenLake 두 가지 제어 과제를 사용하여 QF-tuner를 평가한 결과, PSO, BA, GA, 랜덤 방법 등 다른 최적화 알고리즘보다 우수한 성능을 보였습니다. FrozenLake 과제에서는 보상을 36% 증가시키고 학습 시간을 26% 단축했으며, CartPole 과제에서는 보상을 57% 증가시키고 학습 시간을 20% 단축했습니다.