Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Exploiter de grands modèles linguistiques pour une traduction précise en langue des signes dans des scénarios à faibles ressources

Created by
  • Haebom

Auteur

Luana Bulla, Gabriele Tuccio, Misael Mongiov et Aldo Gangemi

Contour

Cet article propose AulSign, une nouvelle méthode utilisant des modèles linguistiques à grande échelle (MLH) pour répondre aux défis de la traduction du langage naturel vers la langue des signes et au manque de données disponibles. AulSign applique les capacités de traitement de texte des MHL à la traduction en langue des signes en exploitant l'apprentissage contextuel par le biais d'invites dynamiques, de sélection d'échantillons et d'associations ultérieures avec la langue des signes. Les MHL comblent le manque de connaissances en langue des signes en reliant la langue des signes aux descriptions en langue naturelle. Des expériences sur les jeux de données SignBank+ et LaCAM CNR-ISTC pour l'anglais et l'italien démontrent qu'AulSign surpasse les modèles les plus performants existants dans les environnements à faible volume de données. Cette approche a le potentiel d'améliorer l'accessibilité et l'inclusion des communautés linguistiques mal desservies.

Takeaways, Limitations

Takeaways:
Le LLM présente de nouvelles possibilités pour la traduction en langue des signes.
Présentation d’un moyen efficace pour résoudre le problème de la pénurie de données.
Contribuer à améliorer l'accessibilité et l'inclusion des communautés linguistiques marginalisées
Obtenez de meilleures performances que les modèles existants dans les environnements à faible volume de données.
Limitations:
Des recherches supplémentaires sont nécessaires sur l’échelle et la diversité des ensembles de données utilisés.
Possibilité de ne pas refléter pleinement les caractéristiques visuelles et spatiales de la langue des signes
Les performances de généralisation doivent être vérifiées pour différentes langues des signes.
La difficulté de faire correspondre avec précision les descriptions du langage naturel à la langue des signes.
👍