Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Des jetons aux pensées : comment les LLM et les humains échangent la compression contre du sens

Created by
  • Haebom

Auteur

Chen Shani, Dan Jurafsky, Yann LeCun, Ravid Shwartz-Ziv

Contour

Cet article compare et analyse les différences entre la formation des concepts humains et les représentations internes des modèles linguistiques à grande échelle (MLH) d'un point de vue théorique de l'information. Nous constatons que, si les humains compressent les connaissances tout en préservant le sens en associant divers cas à des représentations abstraites, les LHH tendent à se concentrer sur la compression statistique. À l'aide d'un nouveau cadre s'appuyant sur la théorie du taux-distorsion et le principe du goulot d'étranglement informationnel, nous analysons les intégrations de jetons des LHH et montrons que ces derniers forment de larges catégories de concepts compatibles avec le jugement humain, mais peinent à saisir les subtiles différences sémantiques essentielles à la compréhension humaine. En conclusion, les LHH actuels présentent des différences importantes avec les structures cognitives humaines, et nous proposons des pistes pour le développement de LHH avec des représentations conceptuelles plus conviviales.

Takeaways, Limitations_

Takeaways:
Nous présentons un nouveau cadre théorique de l'information pour comparer et analyser quantitativement les différences entre les représentations internes du LLM et les méthodes de formation de concepts humains.
Les LLM révèlent une tendance à se concentrer sur la compression statistique, contrairement aux humains.
Orientations pour le développement de LLM avec des représentations conceptuelles conviviales.
Limitations:
Des recherches supplémentaires sont nécessaires sur la généralité et l’applicabilité du cadre théorique de l’information présenté.
Il convient de prendre en compte les limites des critères de référence LLM et de catégorisation humaine utilisés dans l’analyse.
Manque de suggestions méthodologiques spécifiques pour améliorer la représentation conceptuelle du LLM.
👍