यह शोधपत्र एक नवीन आक्रमण तकनीक, स्पेक्ट्रल मास्किंग एंड इंटरपोलेशन अटैक (SMIA) का प्रस्ताव करता है, जो ध्वनि प्रमाणीकरण प्रणालियों (VAS) की गंभीर कमज़ोरियों को उजागर करता है। SMIA मानव कानों के लिए अश्रव्य आवृत्ति श्रेणियों में रणनीतिक रूप से हेरफेर करके AI-जनित आवाज़ों को नियंत्रित करता है, जिससे प्रतिकूल नमूने उत्पन्न होते हैं जो मौजूदा एंटी-स्पूफिंग प्रतिवादों (CMs) को दरकिनार कर देते हैं। वास्तविक दुनिया के वातावरणों का अनुकरण करने वाले विभिन्न प्रयोगों के माध्यम से, हम अत्याधुनिक (SOTA) मॉडलों के विरुद्ध SMIA की प्रभावशीलता का मूल्यांकन करते हैं। हमने संयुक्त VAS/CM प्रणालियों के लिए कम से कम 82%, स्टैंडअलोन स्पीकर प्रमाणीकरण प्रणालियों के लिए कम से कम 97.5%, और प्रतिवादों के लिए 100% की उच्च आक्रमण सफलता दर प्राप्त की है। यह दर्शाता है कि वर्तमान सुरक्षा प्रणालियाँ अनुकूली प्रतिकूल हमलों के विरुद्ध अपर्याप्त हैं।