यह पत्र RIDGECUT का प्रस्ताव करता है, जो संयोजन अनुकूलन समस्याओं, विशेष रूप से सामान्यीकृत कट समस्या, पर सुदृढीकरण अधिगम (RL) लागू करने के लिए एक नवीन ढाँचा है। डोमेन ज्ञान को शामिल करने की कठिनाई, जो मौजूदा RL-आधारित विधियों की एक सीमा है, को दूर करने के लिए, हम एक ऐसी विधि प्रस्तावित करते हैं जो क्रिया स्थान को सीमित करने के लिए डोमेन ज्ञान का लाभ उठाती है। एक शहरी सड़क नेटवर्क का उदाहरण लेते हुए, हम संकेंद्रित और त्रिज्यीय सड़क संरचनाओं का उपयोग करके ग्राफ़ को एक रैखिक या वृत्ताकार संरचना में बदलते हैं, और अनुक्रमिक ट्रांसफार्मर का उपयोग करके कुशल अधिगम करते हैं। परिणामस्वरूप, हम मौजूदा विधियों की तुलना में कम सामान्यीकृत कट मान प्राप्त करते हैं और ऐसे विभाजन उत्पन्न करते हैं जो स्थानिक लेआउट के साथ निकटता से संरेखित होते हैं। यद्यपि यह शोध यातायात आँकड़ों पर केंद्रित है, हम ग्राफ़ विभाजन समस्याओं के बारे में संरचनात्मक पूर्व ज्ञान को RL में शामिल करने के लिए एक सामान्य तंत्र प्रदान करते हैं।