मुतर्जिम द्विदिश अरबी-अंग्रेज़ी अनुवाद के लिए एक संक्षिप्त किन्तु शक्तिशाली भाषा मॉडल है। कुवैन-1.5B पर आधारित, यह बड़े भाषा मॉडलों की तुलना में काफी छोटा है, फिर भी एक अनुकूलित द्वि-चरणीय शिक्षण दृष्टिकोण और सावधानीपूर्वक चयनित, उच्च-गुणवत्ता वाले प्रशिक्षण डेटासेट के कारण, कई बेंचमार्क पर बड़े मॉडलों से बेहतर प्रदर्शन करता है। इसके अलावा, मौजूदा अरबी-अंग्रेज़ी बेंचमार्क डेटासेट (संकीर्ण डोमेन, छोटे वाक्य, और अंग्रेज़ी स्रोत पूर्वाग्रह) की सीमाओं को दूर करने के लिए, हम एक नया बेंचमार्क, तर्जमा-25 प्रस्तुत करते हैं, जिसमें 5,000 विशेषज्ञ-समीक्षित वाक्य युग्म शामिल हैं। मुतर्जिम तर्जमा-25 अंग्रेज़ी-अरबी अनुवाद कार्य में अत्याधुनिक प्रदर्शन प्राप्त करता है, और GPT-4o मिनी जैसे बड़े स्वामित्व वाले मॉडलों से बेहतर प्रदर्शन करता है। तर्जमा-25 डेटासेट सार्वजनिक रूप से उपलब्ध है।