본 논문은 제약 조건이 있는 라우팅 문제(예: 시간 제약이 있는 외판원 순회 문제, 초안 제한이 있는 외판원 순회 문제)를 해결하기 위한 새로운 학습 프레임워크인 LMask를 제안합니다. LMask는 역추적 메커니즘을 사용하여 실행 가능성 마스크를 점진적으로 개선하는 LazyMask 디코딩 방법과, 역추적에 의한 표현 모호성을 완화하기 위해 검색 추적을 모델에 인코딩하는 정제 강도 임베딩을 도입합니다. 디코딩 중에는 역추적 예산을 설정하고, 학습 중에는 손실 함수에서 제약 위반에 대한 페널티를 부과하여 실행 불가능성을 해소합니다. 이론적으로 접근 방식의 유효성과 확률적 최적성을 보장하며, TSPTW와 TSPDL에 대한 광범위한 실험을 통해 기존 신경망 방식을 능가하는 실행 가능성 비율과 해의 질을 달성함을 보여줍니다.