यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है। यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है। पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।
यह शोधपत्र एक नवीन नामित निकाय सुधार (NEC) विधि प्रस्तावित करता है जो अंत-से-अंत स्वचालित वाक् पहचान प्रणालियों में डोमेन-विशिष्ट नामित निकाय प्रतिलेखन त्रुटियों को दूर करने के लिए वाक् ध्वनिक विशेषताओं का लाभ उठाती है। मौजूदा ध्वन्यात्मक-स्तरीय संपादन दूरी-आधारित NEC मॉडल, त्रुटिपूर्ण और सही शब्दों के बीच रूपात्मक अंतर अधिक होने पर प्रदर्शन में गिरावट का अनुभव करते हैं। हमारी विधि, उम्मीदवार निकायों को पुनः प्राप्त करने के लिए वाक् ध्वनिक विशेषताओं का उपयोग करके और फिर एक जनरेटिव मॉडल का उपयोग करके ASR प्रतिलेखों में निकाय त्रुटियों को एनोटेट करके और सही निकायों से प्रतिस्थापित करके इस सीमा को पार करती है। खुले और स्व-निर्मित परीक्षण सेटों का उपयोग करके प्राप्त प्रायोगिक परिणाम दर्शाते हैं कि प्रस्तावित विधि निकाय सटीकता में उल्लेखनीय सुधार करती है। हम अपने स्व-निर्मित परीक्षण सेट और प्रशिक्षण डेटा को सार्वजनिक रूप से उपलब्ध कराने की योजना बना रहे हैं।
Takeaways, Limitations
•
Takeaways:
◦
एक नई एनईसी विधि प्रस्तुत की गई है जो आवाज की ध्वनिक विशेषताओं का उपयोग करके मौजूदा विधियों की सीमाओं पर काबू पाती है।
◦
त्रुटिपूर्ण शब्द और सही उत्तर के बीच बहुत बड़ा अंतर होने पर भी प्रभावी प्रदर्शन।
◦
वस्तु की सटीकता में सुधार करने में योगदान देता है
◦
स्व-निर्मित डेटासेट जारी करके अनुसंधान की पुनरुत्पादनशीलता और मापनीयता सुनिश्चित करना।
•
Limitations:
◦
प्रस्तावित विधि के सामान्यीकरण प्रदर्शन पर आगे अनुसंधान की आवश्यकता है।
◦
विभिन्न डोमेन और भाषाओं में प्रदर्शन मूल्यांकन की आवश्यकता है।
◦
स्व-निर्मित डेटासेट के आकार और गुणवत्ता की समीक्षा की जानी चाहिए।