यह शोधपत्र बड़े पैमाने के भाषा मॉडल (एलएलएम) का उपयोग करके सारणीबद्ध डेटा की फ़ीचर इंजीनियरिंग में संभावित पूर्वाग्रह की जाँच करता है। हम एलएलएम द्वारा फ़ीचर इंजीनियरिंग में प्रयुक्त ऑपरेटरों (जैसे, दो फ़ीचर जोड़ना) की आवृत्ति में विसंगतियों का पता लगाकर पूर्वाग्रह का पता लगाने की एक विधि प्रस्तावित करते हैं। 27 सारणीबद्ध डेटासेट पर दो बड़े पैमाने के मॉडल और दो छोटे पैमाने के ओपन-सोर्स मॉडल लागू करने पर, हम पाते हैं कि एलएलएम योग जैसे सरल ऑपरेटरों के प्रति पूर्वाग्रही होते हैं और समूह-दर-समुच्चय जैसे जटिल ऑपरेटरों का उपयोग करने में विफल रहते हैं। यह पूर्वाग्रह एलएलएम द्वारा उत्पन्न फ़ीचरों का उपयोग करते समय पूर्वानुमान प्रदर्शन को नकारात्मक रूप से प्रभावित कर सकता है।