Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Une enquête sur le décalage des valeurs dans les textes générés par les LLM pour le patrimoine culturel

작성자
  • Haebom

Auteur

Fan Bu, Zheng Wang, Siyi Wang, Ziyao Liu

Contour

Cet article aborde la question de la cohérence culturelle dans les modèles linguistiques à grande échelle (MLH), de plus en plus utilisés dans des tâches liées au patrimoine culturel, telles que la description de monuments, la traduction de textes anciens, la préservation des traditions orales et la création de contenus pédagogiques. Des inadéquations culturelles, telles que la distorsion historique, les identités culturelles et la simplification excessive de récits culturels complexes, peuvent survenir dans les textes générés par les LH, entraînant de graves conséquences. Afin d'atténuer ces risques, cette étude évalue systématiquement la fiabilité des LH dans la génération de textes culturellement cohérents pour les tâches liées au patrimoine culturel. Nous menons une évaluation exhaustive à l'aide d'un ensemble de données complet de 1 066 tâches de requête couvrant cinq catégories et 17 aspects des systèmes de connaissances du patrimoine culturel, ciblant cinq LHH open source. Nous examinons les types et les taux d'inadéquations culturelles dans les textes générés. Grâce à des approches automatisées et manuelles, nous détectons et analysons efficacement les inadéquations culturelles dans les textes générés par les LHH. Nous constatons que plus de 65 % des textes générés présentent des inadéquations culturelles significatives, certaines tâches présentant des inadéquations quasi totales avec des valeurs culturelles clés. Au-delà de ces résultats, cet article présente un ensemble de données de référence et un flux de travail d’évaluation complet qui peuvent servir de ressources précieuses pour les recherches futures visant à améliorer la sensibilité culturelle et la fiabilité des LLM.

Takeaways, Limitations

Takeaways:
Il s’agit de l’une des premières études à analyser systématiquement la question de l’inadéquation des valeurs culturelles dans les LLM dans le domaine du patrimoine culturel.
Présenter des preuves empiriques démontrant la gravité de l’inadéquation des valeurs culturelles dans les textes produits par les LLM.
Fournir des ensembles de données de référence et des flux de travail d’évaluation pour les recherches futures.
Proposer des pistes de recherche pour améliorer la sensibilité culturelle dans le LLM.
Limitations:
Les types et versions de LLM utilisés dans l’analyse peuvent être limités.
Le potentiel de subjectivité dans la définition et la mesure des écarts de valeurs culturelles.
Possibilité d'utiliser des ensembles de données biaisés en faveur de cultures spécifiques.
Des recherches supplémentaires sont nécessaires pour déterminer la généralisabilité du flux de travail d’évaluation.
👍