यह शोधपत्र MISGENDERED+ प्रस्तुत करता है, जो बड़े पैमाने के भाषा मॉडल (LLM) में लिंग-तटस्थ और उभरते सर्वनाम प्रयोग की निष्पक्षता और समावेशिता के मूल्यांकन हेतु एक विस्तारित मानक है। मौजूदा MISGENDERED मानक की सीमाओं को पार करते हुए, हम पाँच प्रतिनिधि LLM—GPT-4o, क्लाउड 4, डीपसीक-V3, क्वेन टर्बो, और क्वेन 2.5—का मूल्यांकन विभिन्न सेटिंग्स के अंतर्गत करते हैं, जिनमें ज़ीरो-शॉट, फ्यू-शॉट और लिंग पहचान अनुमान शामिल हैं। मूल्यांकन के परिणाम पिछले अध्ययनों की तुलना में बाइनरी और लिंग-तटस्थ सर्वनामों के लिए बेहतर सटीकता प्रदर्शित करते हैं, लेकिन उभरते सर्वनाम और व्युत्क्रम अनुमान कार्यों में असंगतताएँ दर्शाते हैं। यह लिंग पहचान-जागरूक अनुमान क्षमताओं में निरंतर सुधार की आवश्यकता को उजागर करता है।