यह शोधपत्र उन मौजूदा तरीकों की सीमाओं पर प्रकाश डालता है जो वाक् संश्लेषण (TTS) और ध्वनि रूपांतरण (VC) में उच्च-गुणवत्ता वाले वाक् संकेत उत्पन्न करने के लिए मेल स्पेक्ट्रोग्राम जैसे ध्वनिक विशेषताओं का उपयोग करते हैं। मौजूदा तरीके ध्वनिक विशेषताओं को वाक् संकेतों में बदलने और समय क्षेत्र में प्रतिकूल प्रशिक्षण लागू करने के लिए एक वोकोडर का उपयोग करते हैं, लेकिन वाक् संकेतों को अपसैंपलिंग करने में महत्वपूर्ण समय और मेमोरी ओवरहेड होता है। इस समस्या के समाधान के लिए, हम एक वोकोडर प्रोजेक्शन फ़ीचर डिस्क्रिमिनेटर (VPFD) प्रस्तावित करते हैं जो वोकोडर विशेषताओं का उपयोग करता है। एक पूर्व-प्रशिक्षित, निश्चित वोकोडर फ़ीचर एक्सट्रैक्टर और एक एकल अपसैंपलिंग चरण का उपयोग करके, हम प्रदर्शित करते हैं कि प्रसार-आधारित VC आसवन प्रयोगों के माध्यम से, VPFD वाक् डिस्क्रिमिनेटर के बराबर VC प्रदर्शन प्राप्त करता है, जबकि प्रशिक्षण समय और मेमोरी खपत क्रमशः 9.6x और 11.4x कम करता है।