यह शोधपत्र एक नवीन डेटा निर्माण ढाँचे का प्रस्ताव करता है जो बड़े पैमाने के भाषा मॉडल (एलएलएम) में लैंगिक पूर्वाग्रह की समस्या के समाधान हेतु खोजपूर्ण चिंतन को बढ़ावा देता है। यह विधि संरचनात्मक रूप से समान, नैतिक रूप से अस्पष्ट, पुरुष और महिला पात्रों वाले परिदृश्यों के युग्म उत्पन्न करती है, उनके नैतिक निर्णयों की तुलना करती है, और विसंगतियाँ उत्पन्न होने पर मॉडल को संतुलित, लैंगिक-तटस्थ निर्णय उत्पन्न करने के लिए निर्देशित करती है। इन कहानी-निर्णय युग्मों का उपयोग प्रत्यक्ष वरीयता अनुकूलन (डीपीओ) का उपयोग करके मॉडल को परिष्कृत या अनुकूलित करने के लिए किया जाता है। प्रायोगिक परिणाम दर्शाते हैं कि प्रस्तावित विधि सामान्य मॉडल प्रदर्शन को बनाए रखते हुए या उसमें सुधार करते हुए लैंगिक पूर्वाग्रह को उल्लेखनीय रूप से कम करती है। कोड और उत्पन्न डेटा सार्वजनिक रूप से उपलब्ध हैं।