यह शोधपत्र एक स्वचालित गेम डिज़ाइन पुनरावृत्ति ढाँचा प्रस्तुत करता है जो यह समझने पर केंद्रित है कि किसी गेम के स्थिर नियम और विषय-वस्तु गतिशील खिलाड़ी व्यवहार में कैसे परिवर्तित होते हैं। यह एक सुदृढीकरण अधिगम (RL) एजेंट द्वारा गेम का परीक्षण करने और एक बड़े बहुविध मॉडल (LMM) द्वारा एजेंट के व्यवहार के आधार पर गेम को संशोधित करने के द्वारा कार्य करता है। RL एजेंट कई एपिसोड पूरे करता है, संख्यात्मक प्ले मेट्रिक्स या हाल के वीडियो फ़्रेमों का सारांश प्रस्तुत करने वाली इमेज स्ट्रिप्स उत्पन्न करता है। LMM एक गेमप्ले लक्ष्य और वर्तमान गेम कॉन्फ़िगरेशन प्राप्त करता है, प्ले ट्रेस का विश्लेषण करता है, और लक्ष्य की ओर भविष्य की क्रियाओं का मार्गदर्शन करने के लिए कॉन्फ़िगरेशन को संशोधित करता है। प्रायोगिक परिणाम दर्शाते हैं कि LMM, RL एजेंट द्वारा प्रदान किए गए एक्शन ट्रेस का उपयोग करके गेम मैकेनिक्स को पुनरावृत्त रूप से बेहतर बना सकता है, जो AI-सहायता प्राप्त गेम डिज़ाइन के लिए एक व्यावहारिक और मापनीय उपकरण प्रस्तुत करता है।