Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Les géométries de la vérité sont orthogonales entre les tâches

Created by
  • Haebom

Auteur

Waiss Azizian, Michael Kirchhof, Eugène Ndiaye, Louis Bethune, Michal Klein, Pierre Ablin, Marco Cuturi

Contour

Cet article souligne les limites des études antérieures évaluant la précision des réponses à l'aide de vecteurs d'activation pour résoudre le problème de fiabilité des modèles linguistiques à grande échelle (MLH). Ces études affirment que la « géométrie de vérité » peut être apprise en utilisant des classificateurs linéaires pour distinguer les vecteurs d'activation corrects des vecteurs d'activation incorrects générés lors d'une tâche spécifique. Cependant, cet article montre que cette « géométrie de vérité » varie considérablement d'une tâche à l'autre et ne se transfère pas d'une tâche à l'autre. Plus précisément, nous prouvons expérimentalement que les classificateurs linéaires entraînés sur différentes tâches présentent peu de similarités et, en particulier lorsque des régularisateurs appliquant la parcimonie sont utilisés, qu'ils se chevauchent peu. Nous montrons également que les approches à sondes mixtes ou multitâches ne parviennent pas à surmonter ces limites, et nous affirmons que cela est probablement dû au fait que les vecteurs d'activation entre les tâches forment des clusters clairement séparés.

Takeaways, Limitations_

Takeaways: Nous présentons clairement les limites de l'approche par vecteurs d'activation pour l'évaluation de la fiabilité des LLM et suggérons des pistes de recherche futures. Nous soulignons les problèmes liés à l'apprentissage de la « géométrie de la vérité » spécialisé pour une tâche unique et soulignons la nécessité d'une méthode d'évaluation de la fiabilité plus robuste et plus généralisée.
Limitations : Cette étude se limite à l'utilisation de vecteurs d'activation et de classificateurs linéaires spécifiques, et les résultats peuvent varier lorsque d'autres types de vecteurs d'activation ou de classificateurs sont utilisés. De plus, des recherches supplémentaires sont nécessaires sur la généralisabilité à diverses architectures LLM ou types de tâches. Bien que la dépendance de la « géométrie de vérité » à la tâche ait été démontrée, une analyse approfondie de la cause fait défaut.
👍