본 논문은 비즈니스 프로세스에서 자원을 작업에 최적으로 할당하는 동적 작업 할당 문제를 다룬다. 최근 심층 강화 학습(DRL)이 이 문제를 해결하는 최첨단 방법으로 제시되었지만, 작업 또는 자원이 무한한 값을 가질 수 있는 특징을 가질 때 정책 신경망(NN)의 입력 및 출력으로 상태와 가능한 할당을 나타내는 것은 여전히 어려운 과제였다. 본 논문은 무한한 상태 및 행동 공간을 가진 할당 문제를 나타내고 해결하는 방법을 제시하며, 할당 그래프라는 그래프 기반 특징 표현, 표식된 컬러 페트리 네트에서 할당 그래프로의 매핑, 그리고 할당 그래프를 통해 표현된 할당 문제를 해결하도록 학습할 수 있는 근접 정책 최적화 알고리즘의 적용이라는 세 가지 기여를 제공한다. 무한대에 가까운 상태 및 행동 공간 차원을 가진 세 가지 전형적인 할당 문제를 모델링하여 제안된 방법을 평가했으며, 상태 및 행동 공간 차원에 관계없이 최적에 가까운 작업 할당 정책을 나타내고 학습하는 데 적합함을 보였다.