यह शोधपत्र कृत्रिम बुद्धि सहायकों की भ्रामक प्रतिक्रियाओं और उनके बचाव की रणनीतियों के प्रति प्रतिरोध का पता लगाने के लिए विकसित किए गए धोखे जाँचों की प्रभावशीलता का मूल्यांकन करता है। विशेष रूप से, हम व्हाइट-बॉक्स मॉनिटरिंग और ब्लैक-बॉक्स मॉनिटरिंग की तुलना और विश्लेषण इस आधार पर करते हैं कि जाँच की सक्रियण जानकारी तक पहुँच है या नहीं, और ब्लैक-बॉक्स मॉनिटरिंग प्रदर्शन की तुलना में व्हाइट-बॉक्स मॉनिटरिंग प्रदर्शन में सुधार की डिग्री का बेंचमार्क करते हैं। हमें मौजूदा धोखे जाँचों के साथ ब्लैक-बॉक्स प्रदर्शन की तुलना में व्हाइट-बॉक्स प्रदर्शन में एक कमजोर लेकिन उत्साहजनक सुधार दिखाई देता है।