दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

ध्वन्यात्मक ज्ञान के साथ CTC-आधारित गलत उच्चारण का पता लगाने में GOP को बढ़ाना

Created by
  • Haebom

लेखक

आदित्य कमलेश पारिख, क्रिस्टियन तेजेडोर-गार्सिया, कैटिया कुचिआरिनी, हेल्मर स्ट्रिक

रूपरेखा

यह शोधपत्र उच्चारण की शुद्धता (GOP) की दक्षता में सुधार हेतु एक अध्ययन प्रस्तुत करता है, जो कंप्यूटर-सहायता प्राप्त उच्चारण प्रशिक्षण (CAPT) प्रणालियों में प्रयुक्त उच्चारण गुणवत्ता मापन मीट्रिक है। मौजूदा GOPs फ़ोर्स्ड अलाइनमेंट पर निर्भर करते हैं, जो ध्वनिक विविधताओं के कारण लेबलिंग और विभाजन त्रुटियों के प्रति संवेदनशील होता है। अलाइनमेंट-मुक्त विधियाँ प्रस्तावित की गई हैं, लेकिन वे कम्प्यूटेशनल रूप से महंगी हैं और ध्वनि-क्रम की लंबाई तथा ध्वनि-सूची के आकार के कारण प्रदर्शन में गिरावट की समस्याएँ हैं। इसलिए, इस शोधपत्र में, हम एक प्रतिस्थापन-सचेत संरेखण-मुक्त GOP प्रस्तावित करते हैं जो ध्वनि-समूहों और सामान्य शिक्षार्थी त्रुटियों के आधार पर ध्वनि-प्रतिस्थापन को प्रतिबंधित करता है। हम दो L2 अंग्रेज़ी वाक् डेटासेट (My Pronunciation Coach (MPC) और SpeechOcean762) का उपयोग करके प्रस्तावित विधि का मूल्यांकन करते हैं और दर्शाते हैं कि यह मौजूदा विधियों से बेहतर प्रदर्शन करती है।

Takeaways, Limitations

Takeaways:
हम बिना छंटाई के GOP की गणना की दक्षता में सुधार करने के लिए एक नवीन विधि प्रस्तुत करते हैं।
ध्वनि-समूहों और सामान्य शिक्षार्थी त्रुटियों को ध्यान में रखकर सटीकता में सुधार किया गया।
हमने बच्चों के भाषण डेटा सहित विभिन्न डेटासेट पर इसके प्रदर्शन को सत्यापित किया।
यह CAPT प्रणाली की व्यावहारिकता बढ़ाने में योगदान दे सकता है।
Limitations:
प्रस्तावित विधि के प्रदर्शन में सुधार की डिग्री डेटासेट के आधार पर भिन्न हो सकती है।
अधिक विविध भाषाओं और डेटासेट पर अतिरिक्त शोध की आवश्यकता है।
ध्वनि-समूहन और सामान्य शिक्षार्थी त्रुटियों की परिभाषा पर आगे अनुसंधान की आवश्यकता हो सकती है।
👍