본 논문은 클라우드 컴퓨팅 환경에서 동적으로 도착하는 워크플로 작업(DAG로 표현)을 적절한 가상 머신(VM)에 효율적으로 스케줄링하는 비용 인식 동적 워크플로 스케줄링(CADWS) 문제를 다룹니다. 기존 강화학습 기반 접근법의 한계인 정교한 정책 네트워크 설계 및 하이퍼파라미터 민감성 문제를 해결하기 위해, 그래프 어텐션 네트워크(GAN) 기반 정책 네트워크와 진화 전략(Evolution Strategy)을 결합한 새로운 DRL 방법인 GATES를 제안합니다. GATES는 DAG 내 작업 간의 위상 관계를 학습하여 후속 작업에 대한 현재 작업 스케줄링의 영향을 포착하고, 각 VM의 중요도를 학습하여 최적의 VM 선택 확률을 높이며, 진화 전략의 강건성과 탐색 능력, 지연된 보상에 대한 내성을 활용하여 안정적인 정책 학습을 달성합니다. 실험 결과, GATES는 기존 최첨단 알고리즘들을 능가하는 우수한 성능을 보여줍니다.