Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Dhati+ : Modèles linguistiques affinés pour l'évaluation de la subjectivité arabe

Created by
  • Haebom

Auteur

Slimane Bellaouar, Attia Néhar, Soumia Souffi, Mounia Bouameur

Contour

Cet article présente une nouvelle approche pour l'analyse de la subjectivité en arabe. Bien que l'arabe soit une langue linguistiquement riche et morphologiquement complexe, le manque de données annotées à grande échelle freine le développement d'outils précis. Cette étude s'appuie sur des ensembles de données arabes existants (ASTD, LABR, HARD, SANAD) pour constituer un ensemble de données complet, AraDhati+, et affine des modèles de langue arabe de pointe (XLM-RoBERTa, AraBERT, ArabianGPT) pour effectuer la classification de la subjectivité. En utilisant également une approche décisionnelle d'ensemble, nous avons atteint une précision élevée de 97,79 %, démontrant ainsi son efficacité pour répondre aux contraintes de ressources dans le traitement de l'arabe.

Takeaways, Limitations_

Takeaways:
Une nouvelle approche pour analyser la subjectivité arabe et l’ensemble de données AraDhati+ sont présentés.
Atteindre une grande précision (97,79 %) en exploitant un modèle de langue arabe de pointe.
Contribuer à résoudre le problème de pénurie de ressources dans le domaine du traitement du langage naturel arabe.
Présenter la possibilité d’améliorer les performances grâce aux techniques d’ensemble.
Limitations:
Manque de description détaillée de la composition et de la qualité de l'ensemble de données AraDhati+.
Absence de description détaillée des caractéristiques du modèle de langue arabe utilisé et des raisons de son choix.
Manque d’analyse comparative avec d’autres méthodologies d’analyse de subjectivité.
Manque d’examen de l’ensemble de données pour déterminer les biais et la généralisabilité.
Manque d’évaluation des performances dans les applications du monde réel.
👍