본 논문은 클라우드 컴퓨팅 환경에서 동적으로 도착하는 워크플로우 작업(DAG로 표현)을 가상 머신(VM)에 효율적으로 스케줄링하는 비용 인식 동적 워크플로우 스케줄링(CADWS) 문제를 다룹니다. 기존 강화학습(DRL) 기반 방법들의 한계인 정교한 정책 네트워크 설계 및 하이퍼파라미터 민감성 문제를 해결하기 위해, 그래프 어텐션 네트워크(Graph Attention Networks) 기반 정책 네트워크와 진화 전략(Evolution Strategy)을 결합한 새로운 DRL 방법인 GATES를 제안합니다. GATES는 DAG 내 작업 간의 위상 관계를 학습하여 후속 작업에 대한 현재 작업 스케줄링의 영향을 포착하고, 각 VM의 중요도를 평가하여 동적으로 변화하는 VM 자원에 적응하며, 진화 전략의 강건성과 탐색 능력을 활용하여 안정적인 정책 학습을 달성합니다. 실험 결과, GATES는 기존 최첨단 알고리즘들을 능가하는 우수한 성능을 보였습니다. 소스 코드는 깃허브에서 공개됩니다.