[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Découverte de concepts discrets inter-couches pour l'interprétation des modèles de langage

Created by
  • Haebom

Auteur

Ankur Garg, Xuemin Yu, Hassan Sajjad, Samira Ebrahimi Kahou

Contour

Pour relever le défi de la découverte de concepts émergents à travers les couches de Transformer, cet article propose un cadre VQ-VAE inter-couches (CLVQ-VAE). Pour surmonter la difficulté de comprendre l'évolution des caractéristiques au sein d'un modèle de langage à grande échelle, due au mélange linéaire et à la redondance des informations dans le flux résiduel, nous utilisons la quantification vectorielle pour cartographier les représentations sur plusieurs couches et réduire les caractéristiques redondantes du flux résiduel en vecteurs de concepts concis et interprétables. Plus précisément, nous combinons l'échantillonnage top-k basé sur la température et la mise à jour du livre de codes EMA pour contrôler l'espace latent discret et maintenir la diversité du livre de codes. Nous initialisons ensuite ce dernier à l'aide de k-means++ sphériques à l'échelle afin de mieux l'aligner sur la structure sémantique.

Takeaways, Limitations_

Takeaways:
Un nouveau cadre permettant de découvrir efficacement des concepts émergents à travers les couches de Transformer est présenté.
ÉLiminer les informations redondantes dans le flux résiduel pour permettre une analyse plus claire du processus d'évolution des fonctionnalités
Combinaison de la quantification vectorielle avec l'échantillonnage basé sur la température top-k, la mise à jour du livre de codes EMA et les k-moyennes++ sphériques à l'échelle pour améliorer l'interprétabilité et la diversité des vecteurs de concepts.
Limitations:
Aucun résultat expérimental spécifique n’est présenté pour évaluer les performances du cadre proposé.
Son efficacité peut être limitée à des modèles de certaines tailles ou à certains types de données. Une vérification des performances de généralisation est nécessaire.
Une analyse plus approfondie est nécessaire sur l'efficacité et l'évolutivité de la méthode d'initialisation sphérique à échelle k-means++.
👍