Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

LinguaSafe : une référence complète en matière de sécurité multilingue pour les grands modèles linguistiques

Created by
  • Haebom

Auteur

Zhiyuan Ning, Tianle Gu, Jiaxin Song, Shixin Hong, Lingyu Li, Huacan Liu, Jie Li, Yixu Wang, Meng Lingyu, Yan Teng, Yingchun Wang

Contour

Cet article vise à garantir la sécurité des modèles linguistiques à grande échelle (MLH) dans divers contextes linguistiques et culturels. Afin de pallier le manque d'évaluations complètes et de données diversifiées pour les évaluations de sécurité des LMH multilingues existantes, nous présentons LinguaSafe, un référentiel de sécurité multilingue comprenant 45 000 éléments répartis en 12 langues, du hongrois au malais. Construit en combinant traductions, variantes de traductions et données sources, LinguaSafe fournit un cadre d'évaluation multidimensionnel et granulaire qui comprend des évaluations de sécurité directes et indirectes, ainsi qu'une évaluation supplémentaire de la sursensibilité. Nous démontrons que les résultats des évaluations de sécurité et d'utilisabilité varient considérablement selon les langues et les domaines, soulignant l'importance de l'évaluation de la sécurité des LMH multilingues. L'ensemble de données et le code sont distribués ouvertement pour soutenir des recherches ultérieures.

Takeaways, Limitations

Takeaways:
Nous fournissons LinguaSafe, une référence complète pour évaluer la sécurité des LLM multilingues.
Il s’attaque aux biais linguistiques existants en incluant plusieurs langues (du hongrois au malais).
Fournit un cadre d’évaluation multidimensionnel comprenant des évaluations de sécurité directes et indirectes.
Les résultats de l’évaluation de la sécurité des LLM multilingues montrent des différences significatives selon les langues et les domaines.
L'ensemble de données et le code publiés jettent les bases de futures recherches multilingues sur la sécurité LLM.
Limitations:
La taille et la couverture linguistique de l’ensemble de données LinguaSafe peuvent être encore étendues.
Une validation supplémentaire de l’objectivité et de la fiabilité du cadre d’évaluation peut être requise.
Il est possible que des préjugés envers certaines langues ou certains contextes culturels existent encore.
L'adaptabilité aux nouvelles architectures et fonctionnalités LLM nécessite une étude plus approfondie.
👍