Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Dhati+: Modelos lingüísticos amplios y perfeccionados para la evaluación de la subjetividad del árabe

Created by
  • Haebom

Autor

Slimane Bellaouar, Attia Nehar, Soumia Souffi, Mounia Bouameur

Describir

Este artículo presenta un enfoque novedoso para el análisis de la subjetividad en árabe. Si bien el árabe es lingüísticamente rico y morfológicamente complejo, la falta de datos anotados a gran escala dificulta el desarrollo de herramientas precisas. Este estudio aprovecha los conjuntos de datos árabes existentes (ASTD, LABR, HARD, SANAD) para construir un conjunto de datos completo, AraDhati+, y perfecciona los modelos de lengua árabe de vanguardia (XLM-RoBERTa, AraBERT, ArabianGPT) para realizar la clasificación de la subjetividad. Mediante el uso adicional de un enfoque de toma de decisiones por conjuntos, logramos una alta precisión del 97,79 %, lo que demuestra que este enfoque es eficaz para abordar las limitaciones de recursos en el procesamiento del árabe.

Takeaways, Limitations

Takeaways:
Se presenta un nuevo enfoque para analizar la subjetividad árabe y el conjunto de datos AraDhati+.
Lograr una alta precisión (97,79%) aprovechando un modelo de idioma árabe de última generación.
Contribuir a la solución del problema de escasez de recursos en el campo del procesamiento del lenguaje natural árabe.
Presentando la posibilidad de mejora del rendimiento a través de técnicas de conjunto.
Limitations:
Falta de descripción detallada de la composición y calidad del conjunto de datos AraDhati+.
Falta de descripción detallada de las características del modelo de lengua árabe utilizado y las razones de su elección.
Falta de análisis comparativo con otras metodologías de análisis de subjetividad.
Falta de revisión del conjunto de datos para detectar sesgos y generalización.
Falta de evaluación del desempeño en aplicaciones del mundo real.
👍