본 논문은 여행판매원 문제(TSP)를 위한 라우팅 알고리즘의 성능 향상을 목표로, 기존 Lin-Kernighan-Helsgaun (LKH) 알고리즘의 한계를 극복하기 위한 새로운 방법을 제안한다. 기존 LKH 알고리즘은 고정된 후보 간선 집합을 사용하여 지역적 최적점에 빠지기 쉬운 단점이 있다. 본 논문에서는 다중 무장 밴딧 모델을 활용하여 각 반복마다 가장 적합한 후보 간선을 동적으로 선택함으로써, LKH 알고리즘이 더욱 효율적으로 최적 해를 찾도록 개선한다. 다양한 TSP 벤치마크에 대한 실험 결과, 제안된 방법이 LKH 및 LKH-3 알고리즘의 성능을 상당히 향상시키는 것을 보여준다.