यह शोधपत्र जनरेटिव लैंग्वेज मॉडल (LLM) में गार्डरेल्स के पूर्वाग्रह की जाँच करता है। विशेष रूप से, हम GPT-3.5 का उपयोग करके, LLM अनुरोधों के अस्वीकार होने की संभावना पर उपयोगकर्ता की पृष्ठभूमि की जानकारी (आयु, लिंग, जाति, राजनीतिक संबद्धता, आदि) के प्रभाव का विश्लेषण करते हैं। हमारे निष्कर्ष बताते हैं कि युवा महिला और एशियाई अमेरिकी उपयोगकर्ताओं द्वारा निषिद्ध या अवैध जानकारी का अनुरोध करने पर अस्वीकार किए जाने की संभावना अधिक होती है, और गार्डरेल्स उपयोगकर्ता के राजनीतिक झुकाव के विपरीत अनुरोधों को अस्वीकार कर देते हैं। इसके अलावा, हम पाते हैं कि खेल प्रशंसक जैसी हानिरहित जानकारी भी उपयोगकर्ता के राजनीतिक झुकाव का अनुमान लगा सकती है और गार्डरेल सक्रियण को प्रभावित कर सकती है।