दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

मुतरजिम: लघु भाषा मॉडल के साथ द्विदिशात्मक अरबी-अंग्रेज़ी अनुवाद को आगे बढ़ाना

Created by
  • Haebom

लेखक

खलील हेन्नारा, मुहम्मद ह्रेडेन, मोहम्मद मोताइस्म हामेद, ज़ीना अल्दालाल, सारा क्रोउफ, सफवान अलमोधायन

रूपरेखा

मुतर्जिम द्विदिश अरबी-अंग्रेज़ी अनुवाद के लिए एक संक्षिप्त किन्तु शक्तिशाली भाषा मॉडल है। कुवैन-1.5B पर आधारित, यह बड़े भाषा मॉडलों की तुलना में काफी छोटा है, फिर भी एक अनुकूलित द्वि-चरणीय शिक्षण दृष्टिकोण और सावधानीपूर्वक चयनित, उच्च-गुणवत्ता वाले प्रशिक्षण डेटासेट के कारण, कई बेंचमार्क पर बड़े मॉडलों से बेहतर प्रदर्शन करता है। इसके अलावा, मौजूदा अरबी-अंग्रेज़ी बेंचमार्क डेटासेट (संकीर्ण डोमेन, छोटे वाक्य, और अंग्रेज़ी स्रोत पूर्वाग्रह) की सीमाओं को दूर करने के लिए, हम एक नया बेंचमार्क, तर्जमा-25 प्रस्तुत करते हैं, जिसमें 5,000 विशेषज्ञ-समीक्षित वाक्य युग्म शामिल हैं। मुतर्जिम तर्जमा-25 अंग्रेज़ी-अरबी अनुवाद कार्य में अत्याधुनिक प्रदर्शन प्राप्त करता है, और GPT-4o मिनी जैसे बड़े स्वामित्व वाले मॉडलों से बेहतर प्रदर्शन करता है। तर्जमा-25 डेटासेट सार्वजनिक रूप से उपलब्ध है।

Takeaways, Limitations

Takeaways:
हम यह प्रदर्शित करते हैं कि छोटे पैमाने के भाषा मॉडल बड़े पैमाने के मॉडल की तुलना में प्रतिस्पर्धी अनुवाद प्रदर्शन प्राप्त कर सकते हैं।
कम्प्यूटेशनल लागत और सीखने की आवश्यकताओं को महत्वपूर्ण रूप से कम करता है।
हम एक नया बेंचमार्क, तर्जामा-25 प्रस्तुत करते हैं, जो मौजूदा अरबी-अंग्रेजी अनुवाद मूल्यांकन डेटासेट की सीमाओं को पार करता है।
तरजामा-25 डेटासेट के विमोचन के माध्यम से अरबी-अंग्रेजी अनुवाद अनुसंधान की उन्नति में योगदान देना।
Limitations:
मुतार्जिम मॉडल के लिए विशिष्ट Limitations या प्रदर्शन गिरावट मामलों का अभाव।
टारजामा-25 डेटासेट अन्य बड़े पैमाने के बेंचमार्क की तुलना में अपेक्षाकृत छोटा हो सकता है (5,000 वाक्य जोड़े डेटा की अपेक्षाकृत छोटी मात्रा हो सकते हैं)।
कुवैन-1.5B मॉडल के विस्तृत विवरण का अभाव।
👍