हम एक बार-बार दोहराए जाने वाले बहु-उद्देश्यीय स्टैकेलबर्ग खेल में नेता पुरस्कार हेरफेर का अध्ययन करते हैं। नेता रणनीतिक रूप से अनुयायियों की नियतात्मक इष्टतम प्रतिक्रियाओं को प्रभावित कर सकते हैं, उदाहरण के लिए, अपने स्वयं के पुरस्कार का एक अंश देकर। अनुयायियों के उपयोगिता फलन (जो कई उद्देश्यों के लिए उनकी प्राथमिकताओं को दर्शाते हैं) को रैखिक माना जाता है, हालाँकि अज्ञात है, और उनके भारांक प्राचलों का अनुमान अंतःक्रियाओं के माध्यम से लगाया जाना चाहिए। इससे नेता के सामने एक क्रमिक निर्णय लेने का कार्य प्रस्तुत होता है, जिसके लिए वरीयता प्रेरण और तत्काल उपयोगिता अधिकतमीकरण के बीच संतुलन की आवश्यकता होती है। यह अध्ययन इस समस्या को औपचारिक रूप देता है और अपेक्षित उपयोगिता (EU) और दीर्घकालिक अपेक्षित उपयोगिता (longEU) पर आधारित एक हेरफेर नीति का प्रस्ताव करता है। यह नीति नेता के कार्यों और प्रोत्साहन विकल्पों का मार्गदर्शन करती है, जिससे उन्हें अल्पकालिक लाभों और दीर्घकालिक प्रभावों के बीच संतुलन बनाने की अनुमति मिलती है। हम प्रदर्शित करते हैं कि अनंत बार दोहराई जाने वाली अंतःक्रियाओं के तहत longEU एक इष्टतम हेरफेर में परिवर्तित हो जाता है। एक बेंचमार्क वातावरण में प्रायोगिक परिणाम प्रदर्शित करते हैं कि प्रस्तावित विधि संचयी नेता उपयोगिता को बढ़ाती है और अनुयायी उपयोगिता फलनों के स्पष्ट बातचीत या पूर्व ज्ञान के बिना भी, पारस्परिक रूप से लाभकारी परिणामों को बढ़ावा देती है।