Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Mutarjim: Impulsando la traducción bidireccional árabe-inglés con un modelo de lenguaje reducido

Created by
  • Haebom

Autor

Khalil Hennara, Muhammad Hreden, Mohamed Motaism Hamed, Zeina Aldallal, Sara Chrouf, Safwan AlModhayan

Describir

Mutarjim es un modelo lingüístico compacto pero potente para la traducción bidireccional árabe-inglés. Basado en Kuwain-1.5B, es significativamente más pequeño que los modelos lingüísticos más grandes, pero los supera en múltiples pruebas de referencia gracias a un enfoque de aprendizaje optimizado en dos etapas y a un conjunto de datos de entrenamiento de alta calidad cuidadosamente seleccionado. Además, para superar las limitaciones de los conjuntos de datos de referencia árabe-inglés existentes (dominio limitado, oraciones cortas y sesgo de la fuente en inglés), presentamos un nuevo modelo de referencia, Tarjama-25, compuesto por 5000 pares de oraciones revisados ​​por expertos. Mutarjim alcanza un rendimiento de vanguardia en la tarea de traducción inglés-árabe de Tarjama-25, superando a modelos propietarios de gran tamaño como GPT-4o mini. El conjunto de datos Tarjama-25 está disponible públicamente.

Takeaways, Limitations

Takeaways:
Demostramos que los modelos de lenguaje a pequeña escala pueden lograr un rendimiento de traducción competitivo en comparación con los modelos a gran escala.
Reduce significativamente los costos computacionales y los requisitos de aprendizaje.
Presentamos un nuevo punto de referencia, Tarjama-25, que supera las limitaciones de los conjuntos de datos de evaluación de traducción árabe-inglés existentes.
Contribuir al avance de la investigación en la traducción del árabe al inglés mediante la publicación del conjunto de datos Tarjama-25.
Limitations:
Falta de casos específicos de Limitations o de degradación del rendimiento para el modelo Mutarjim.
El conjunto de datos Tarjama-25 puede ser relativamente pequeño en comparación con otros puntos de referencia a gran escala (5000 pares de oraciones pueden ser una cantidad relativamente pequeña de datos).
Falta de descripción detallada del modelo Kuwain-1.5B.
👍