본 논문은 NP-hard Integer Linear Programming (ILP) 문제에 대한 효율적인 근사해를 찾는 새로운 강화학습 기반 초기 근사 해법(RL-SPH)을 제안한다. 기존의 end-to-end 학습 기반 방법들이 독립적으로 실행 가능한 해를 생성하지 못하고 주로 이진 변수에만 집중하는 한계를 극복하고자, RL-SPH는 비이진 정수 변수를 포함하는 ILP 문제에서도 독립적으로 실행 가능한 해를 생성할 수 있다. 실험 결과, RL-SPH는 기존의 근사 해법들에 비해 훨씬 빠르게 고품질의 실행 가능한 해를 얻었으며, 평균적으로 44배 낮은 primal gap과 2.3배 낮은 primal integral을 달성했다.