Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Régression basée sur le décodage

Created by
  • Haebom

Auteur

Chanson Xingyou, Dara Bahri

Contour

Cet article soutient théoriquement l'idée selon laquelle les modèles de langage peuvent décoder les prédictions de chiffres en chaînes pour l'analyse de régression, et explore l'utilisation d'un modèle de décodage de séquence causale comme tête de régression de chiffres pour diverses représentations de caractéristiques. Bien qu'entraînée selon une approche courante de prédiction du prochain jeton par perte d'entropie croisée, nous constatons que la tête basée sur le décodeur est aussi performante qu'une tête ponctuelle standard pour les tâches de régression standard et présente la flexibilité nécessaire pour capturer des distributions de chiffres lisses, telles que l'estimation de densité.

Takeaways, Limitations_

Takeaways: Nous démontrons que l'utilisation du décodeur d'un modèle de langage permet de construire une tête de régression numérique flexible et efficace pour diverses représentations de caractéristiques. Elle présente des performances similaires à celles des têtes ponctuelles standard, tout en étant capable de capturer des distributions numériques lisses.
Limitations: Cet article n'a mené des expériences que sur un type spécifique de tâche de régression et d'ensemble de données ; nous ne pouvons donc pas garantir les mêmes performances sur d'autres types de tâches de régression ou d'ensembles de données. Des expériences et des analyses plus diversifiées sont nécessaires. De plus, des recherches supplémentaires sont nécessaires pour approfondir et élargir les bases théoriques.
👍