본 논문은 클라우드 컴퓨팅 환경에서 동적으로 도착하는 워크플로우 작업을 효율적으로 스케줄링하는 비용 인식 동적 워크플로우 스케줄링(CADWS) 문제를 다룬다. DAG(Directed Acyclic Graph)로 표현되는 작업들을 적절한 가상 머신(VM)에 스케줄링하는 효과적인 스케줄링 정책을 설계하는 것이 핵심 과제이다. 기존의 심층 강화 학습(DRL) 기반 방법들의 성능은 문제 특화 정책 네트워크 설계, 하이퍼파라미터, 보상 피드백 설계에 크게 의존하는 한계를 가지고 있다. 본 논문에서는 그래프 어텐션 네트워크(Graph Attention Networks) 기반 정책 네트워크와 진화 전략(Evolution Strategy)을 결합한 새로운 DRL 방법인 GATES를 제안한다. GATES는 DAG 내 작업 간의 위상 관계를 학습하여 현재 작업 스케줄링이 후속 작업에 미치는 영향을 포착하고, 각 VM의 중요도를 평가하여 동적으로 변화하는 VM 자원에 적응하며, 진화 전략의 강건성과 탐색 능력, 지연된 보상에 대한 내성을 활용하여 안정적인 정책 학습을 달성한다. 실험 결과, GATES는 기존 최첨단 알고리즘들을 능가하는 우수한 성능을 보였다. 소스 코드는 Github에서 공개되어 있다.