[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Est-ce de la pure fantaisie ? Les représentations du modèle linguistique reflètent les jugements humains sur la plausibilité des événements.

Created by
  • Haebom

Auteur

Michael A. Lepori, Jennifer Hu, Ishita Dasgupta, Roma Patel, Thomas Serre, Ellie Pavlick

Contour

Cet article examine la capacité des modèles de langage (ML) utilisés dans diverses tâches à identifier les catégories modales (telles que la possibilité, l'impossibilité et l'illogisme) des phrases. Alors que des études antérieures ont remis en question la capacité des ML à classer les catégories modales, cette étude identifie des représentations linéaires (vecteurs de différence modale) qui distinguent les catégories modales au sein de divers ML. Les résultats de l'analyse montrent que les ML présentent des capacités de classification des catégories modales plus fiables que les études précédentes, et que les vecteurs de différence modale apparaissent dans un ordre cohérent avec l'amélioration des performances du modèle (augmentation du nombre d'étapes d'apprentissage, des couches et du nombre de paramètres). De plus, nous démontrons que les vecteurs de différence modale identifiés dans les activations des ML peuvent être utilisés pour modéliser finement les comportements de catégorisation humaine, ce qui peut apporter de nouvelles perspectives sur la façon dont les humains distinguent les catégories modales en corrélant les projections le long des vecteurs de différence modale avec les évaluations des participants humains des caractéristiques interprétables. En conclusion, cette étude fournit de nouvelles perspectives sur la catégorisation modale des LM à l’aide de techniques d’interprétabilité des machines et peut contribuer à une meilleure compréhension de la catégorisation modale humaine.

Takeaways, Limitations_

Takeaways:
Nous démontrons que notre modèle de langage possède une capacité de classification des catégories modales plus sophistiquée que les études précédentes.
Nous élucidons la relation entre l’amélioration des performances du modèle et l’ordre d’apparition cohérent des vecteurs de différence modale.
Possibilité de modéliser le comportement de catégorisation humaine à l'aide de vecteurs de différence modale au sein des activations LM.
Fournit de nouvelles perspectives sur la façon dont les humains distinguent les catégories modales.
Démontrer l’utilité de l’analyse LM en utilisant des techniques d’interprétabilité mécanique.
Limitations:
Aucun __T2171_____ spécifique n'est mentionné dans l'article. Des recherches supplémentaires devraient être nécessaires pour vérifier les performances de généralisation du vecteur de différence modale, son applicabilité à divers modèles et tâches linguistiques, ainsi que la robustesse de la corrélation avec le comportement de catégorisation humain.
👍