यह शोधपत्र उच्चारण की शुद्धता (GOP) की दक्षता में सुधार हेतु एक अध्ययन प्रस्तुत करता है, जो कंप्यूटर-सहायता प्राप्त उच्चारण प्रशिक्षण (CAPT) प्रणालियों में प्रयुक्त उच्चारण गुणवत्ता मापन मीट्रिक है। मौजूदा GOPs फ़ोर्स्ड अलाइनमेंट पर निर्भर करते हैं, जो ध्वनिक विविधताओं के कारण लेबलिंग और विभाजन त्रुटियों के प्रति संवेदनशील होता है। अलाइनमेंट-मुक्त विधियाँ प्रस्तावित की गई हैं, लेकिन वे कम्प्यूटेशनल रूप से महंगी हैं और ध्वनि-क्रम की लंबाई तथा ध्वनि-सूची के आकार के कारण प्रदर्शन में गिरावट की समस्याएँ हैं। इसलिए, इस शोधपत्र में, हम एक प्रतिस्थापन-सचेत संरेखण-मुक्त GOP प्रस्तावित करते हैं जो ध्वनि-समूहों और सामान्य शिक्षार्थी त्रुटियों के आधार पर ध्वनि-प्रतिस्थापन को प्रतिबंधित करता है। हम दो L2 अंग्रेज़ी वाक् डेटासेट (My Pronunciation Coach (MPC) और SpeechOcean762) का उपयोग करके प्रस्तावित विधि का मूल्यांकन करते हैं और दर्शाते हैं कि यह मौजूदा विधियों से बेहतर प्रदर्शन करती है।