दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

मल्टीजेन: एलएलएम के साथ बच्चों के अनुकूल बहुभाषी भाषण जनरेटर

Created by
  • Haebom

लेखक

ज़ियाओक्स्यू गाओ, हुआयुन झांग, नैन्सी एफ. चेन

रूपरेखा

यह शोधपत्र विविध भाषाओं और सांस्कृतिक पृष्ठभूमियों, जिनमें निम्न-संसाधन वाली भाषाएँ भी शामिल हैं, में उच्च-गुणवत्तापूर्ण, बाल-सुलभ वाक् निर्माण प्राप्त करने पर केंद्रित है। हमारा उद्देश्य जनरेटिव वाक् मॉडल की क्षमता का लाभ उठाना है, जिनकी बच्चों के लिए भाषा सीखने जैसे व्यावहारिक अनुप्रयोगों में उपयोगिता है। इस उद्देश्य से, हम मल्टीजेन का प्रस्ताव करते हैं, जो एक बहुभाषी वाक् निर्माण मॉडल है जो निम्न-संसाधन वाली भाषाओं के लिए अनुकूलित वाक् निर्माण हेतु एलएलएम आर्किटेक्चर का उपयोग करता है। मल्टीजेन का उद्देश्य सांस्कृतिक रूप से उपयुक्त संदर्भों में बच्चों के एआई सिस्टम के साथ संचार को सुगम बनाना है, इसके लिए तीन निम्न-संसाधन वाली भाषाओं का उपयोग किया जाता है: मंदारिन, मलय और सिंगापुरी लहजे वाली तमिल। वस्तुनिष्ठ मेट्रिक्स और व्यक्तिपरक मूल्यांकन सहित प्रायोगिक परिणाम दर्शाते हैं कि प्रस्तावित मल्टीजेन आधारभूत विधियों से बेहतर प्रदर्शन करता है।

Takeaways, Limitations

Takeaways:
कम संसाधन वाली भाषाओं के लिए बाल-अनुकूल बहुभाषी भाषण निर्माण मॉडल के लिए एक नया दृष्टिकोण प्रस्तुत किया गया है।
एलएलएम आर्किटेक्चर का उपयोग करके कम संसाधन वाली भाषाओं के लिए भाषण निर्माण की समस्या को हल करने में योगदान दें।
सांस्कृतिक संदर्भ को ध्यान में रखते हुए बाल-अनुकूल एआई प्रणालियों के साथ बातचीत की संभावना प्रस्तुत करना।
वस्तुनिष्ठ और व्यक्तिपरक मूल्यांकन के माध्यम से मॉडल उत्कृष्टता का सत्यापन।
Limitations:
पेपर में प्रयुक्त तीन कम संसाधन वाली भाषाओं के अलावा अन्य भाषाओं में विस्तारशीलता पर विचार करने की आवश्यकता है।
बाल-अनुकूल मानदंड-निर्धारण और मूल्यांकन विधियों की वस्तुनिष्ठता और सामान्यीकरण पर आगे अनुसंधान की आवश्यकता है।
मल्टीजेन मॉडलों के लिए प्रशिक्षण डेटा के आकार और गुणवत्ता के बारे में विस्तृत जानकारी का अभाव।
वास्तविक बाल उपयोगकर्ताओं के साथ दीर्घकालिक प्रयोज्यता परीक्षण परिणामों का अभाव।
👍