यह शोधपत्र कॉस्ट-अवेयर डायनेमिक वर्कफ़्लो शेड्यूलिंग (CADWS) समस्या पर केंद्रित है, जो क्लाउड कंप्यूटिंग परिवेश में गतिशील रूप से आने वाले वर्कफ़्लो कार्यों को कुशलतापूर्वक शेड्यूल करता है। एक प्रभावी शेड्यूलिंग नीति तैयार करना जो निर्देशित चक्रीय ग्राफ़ (DAG) के रूप में दर्शाए गए कार्यों को उपयुक्त वर्चुअल मशीनों (VMs) के लिए शेड्यूल करे, एक प्रमुख चुनौती है। मौजूदा डीप रीइन्फोर्समेंट लर्निंग (DRL)-आधारित विधियाँ समस्या-विशिष्ट पॉलिसी नेटवर्क डिज़ाइन, हाइपरपैरामीटर्स और रिवॉर्ड फ़ीडबैक पर अत्यधिक निर्भरता के कारण सीमाओं से ग्रस्त हैं। इस शोधपत्र में, हम GATES का प्रस्ताव करते हैं, जो एक नवीन DRL विधि है जो ग्राफ़ अटेंशन नेटवर्क (GANs) पर आधारित एक पॉलिसी नेटवर्क को एक इवोल्यूशन स्ट्रैटेजी के साथ जोड़ती है। GATES, DAG के भीतर कार्यों के बीच टोपोलॉजिकल संबंधों को सीखता है ताकि वर्तमान कार्य शेड्यूलिंग का बाद के कार्यों पर प्रभाव दर्ज किया जा सके। यह गतिशील रूप से बदलते VM संसाधनों के अनुकूल होने के लिए प्रत्येक VM के महत्व का आकलन करता है। यह स्थिर पॉलिसी लर्निंग प्राप्त करने के लिए इवोल्यूशन स्ट्रैटेजी की मज़बूती और अन्वेषणात्मक शक्ति के साथ-साथ विलंबित रिवॉर्ड्स के प्रति इसकी सहनशीलता का लाभ उठाता है। प्रायोगिक परिणाम दर्शाते हैं कि GATES मौजूदा अत्याधुनिक एल्गोरिदम से बेहतर प्रदर्शन करता है। इसका स्रोत कोड GitHub पर उपलब्ध है।