दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

एफएलएम-ऑडियो: नेचुरल मोनोलॉग्स, दोहरे प्रशिक्षण के माध्यम से नेटिव फुल-डुप्लेक्स चैटबॉट्स को बेहतर बनाता है

Created by
  • Haebom

लेखक

यिकुन याओ, जियांग ली, शिन जियांग, ज़ुएझी फांग, नाइतोंग यू, वेन्जिया मा, ऐक्सिन सन, येक्वान वांग

रूपरेखा

यह शोधपत्र एक मूल समाधान प्रस्तुत करता है जो पूर्ण-द्वैध संवादात्मक मॉडल में कम विलंबता प्राप्त करने के लिए प्रत्येक समय चरण में कई चैनलों को एक साथ जोड़ता है। मौजूदा शब्द-स्तरीय संरेखण विधियों द्वारा भाषा मॉडलिंग के प्रदर्शन को कम करने की समस्या का समाधान करने के लिए, हम "प्राकृतिक एकालाप" प्रस्तुत करते हैं, जिसमें निरंतर वाक्य और विराम होते हैं जो मानवीय संवादात्मक व्यवहार की नकल करते हैं। प्राकृतिक एकालापों और ऑडियो के बीच अर्थगत संरेखण प्राप्त करने के लिए, हम एक द्वि-शिक्षण विधि विकसित करते हैं जो भाषा सीखने के लिए एकालापों की स्थितियों को बारी-बारी से बदलती है। इस द्वि-शिक्षण विधि, FLM-ऑडियो, को फिर 7B मापदंडों वाला एक पूर्ण-द्वैध संवादात्मक चैटबॉट, विकसित किया गया है। प्रायोगिक परिणाम दर्शाते हैं कि FLM-ऑडियो मौजूदा मॉडलों की तुलना में बेहतर प्रतिक्रिया गुणवत्ता और संवादात्मक अनुभव प्रदान करता है, जबकि इसके लिए काफी कम प्रशिक्षण डेटा की आवश्यकता होती है।

Takeaways, Limitations

Takeaways:
हम एक मूल पूर्ण-द्वैध संवादात्मक मॉडल में एक साथ कम विलंबता और उच्च भाषा मॉडलिंग प्रदर्शन प्राप्त करने की व्यवहार्यता को प्रदर्शित करते हैं।
प्राकृतिक एकालाप और दोहरी शिक्षण विधियों का उपयोग करके एक कुशल पूर्ण-द्वैध वार्तालाप मॉडल सीखने की विधि प्रस्तुत की गई है।
हल्के वजन वाले मॉडल विकसित करने की संभावना प्रस्तुत करना जो छोटे प्रशिक्षण डेटा के साथ भी उत्कृष्ट प्रदर्शन प्राप्त करते हैं।
Limitations:
प्रस्तावित विधि के सामान्यीकरण प्रदर्शन का आगे सत्यापन आवश्यक है।
विभिन्न वार्तालाप प्रकारों और भाषाओं के लिए प्रयोज्यता अध्ययन की आवश्यकता है।
7B मापदंडों के साथ FLM-ऑडियो मॉडल के कम्प्यूटेशनल संसाधन खपत का विश्लेषण आवश्यक है।
👍