दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

ASR नामित इकाई सुधार के लिए जनरेटिव एनोटेशन

Created by
  • Haebom

लेखक

युआनचांग लुओ, डेमेंग वेई, शाओजुन ली, हेंगचाओ शांग, जियाक्सिन गुओ, ज़ोंगयाओ ली, झांगलिन वू, ज़ियाओयू चेन, झिकियांग राव, जिनलोंग यांग, हाओ यांग

रूपरेखा

यह शोधपत्र एक नवीन नामित निकाय सुधार (NEC) विधि प्रस्तावित करता है जो अंत-से-अंत स्वचालित वाक् पहचान प्रणालियों में डोमेन-विशिष्ट नामित निकाय प्रतिलेखन त्रुटियों को दूर करने के लिए वाक् ध्वनिक विशेषताओं का लाभ उठाती है। मौजूदा ध्वन्यात्मक-स्तरीय संपादन दूरी-आधारित NEC मॉडल, त्रुटिपूर्ण और सही शब्दों के बीच रूपात्मक अंतर अधिक होने पर प्रदर्शन में गिरावट का अनुभव करते हैं। हमारी विधि, उम्मीदवार निकायों को पुनः प्राप्त करने के लिए वाक् ध्वनिक विशेषताओं का उपयोग करके और फिर एक जनरेटिव मॉडल का उपयोग करके ASR प्रतिलेखों में निकाय त्रुटियों को एनोटेट करके और सही निकायों से प्रतिस्थापित करके इस सीमा को पार करती है। खुले और स्व-निर्मित परीक्षण सेटों का उपयोग करके प्राप्त प्रायोगिक परिणाम दर्शाते हैं कि प्रस्तावित विधि निकाय सटीकता में उल्लेखनीय सुधार करती है। हम अपने स्व-निर्मित परीक्षण सेट और प्रशिक्षण डेटा को सार्वजनिक रूप से उपलब्ध कराने की योजना बना रहे हैं।

Takeaways, Limitations

Takeaways:
एक नई एनईसी विधि प्रस्तुत की गई है जो आवाज की ध्वनिक विशेषताओं का उपयोग करके मौजूदा विधियों की सीमाओं पर काबू पाती है।
त्रुटिपूर्ण शब्द और सही उत्तर के बीच बहुत बड़ा अंतर होने पर भी प्रभावी प्रदर्शन।
वस्तु की सटीकता में सुधार करने में योगदान देता है
स्व-निर्मित डेटासेट जारी करके अनुसंधान की पुनरुत्पादनशीलता और मापनीयता सुनिश्चित करना।
Limitations:
प्रस्तावित विधि के सामान्यीकरण प्रदर्शन पर आगे अनुसंधान की आवश्यकता है।
विभिन्न डोमेन और भाषाओं में प्रदर्शन मूल्यांकन की आवश्यकता है।
स्व-निर्मित डेटासेट के आकार और गुणवत्ता की समीक्षा की जानी चाहिए।
👍