[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Décodage flexible et efficace avec contraintes grammaticales

Created by
  • Haebom

Auteur

Parc Kanghee, Timothy Zhou, Loris D'Antoni

Contour

Cet article aborde la question de la production d'une sortie structurée par un modèle de langage à grande échelle (LLM) respectant des règles syntaxiques précises, telles que des fragments de code ou des données formatées. Le décodage par contraintes grammaticales (GCD) garantit la conformité de la sortie LLM à ces règles en masquant les tokens qui conduiraient à une sortie n'appartenant pas à une grammaire a-contextuelle (CFG) donnée. Les algorithmes PGCD existants doivent calculer l'alignement des tokenizers de sous-mots LLM avec les tokens d'une CFG donnée pour garantir la fiabilité, et calculer les masques de tokens à partir de ces informations, ce qui est très inefficace. Cet article présente un nouvel algorithme PGCD et son implémentation, qui permet un prétraitement hors ligne 17,71 fois plus rapide que les approches existantes, tout en conservant l'efficacité de pointe du calcul de masques en ligne.

Takeaways, Limitations

Takeaways:
Nous avons considérablement réduit le temps de prétraitement hors ligne, qui constitue le principal goulot d'étranglement de l'algorithme GCD existant (amélioration de 17,71x), augmentant ainsi la praticité de la génération de données structurées à l'aide de LLM.
Nous fournissons un algorithme GCD adapté aux applications en temps réel en améliorant la vitesse de prétraitement tout en maintenant l'efficacité du calcul du masque en ligne.
Limitations:
Les améliorations de performance de l'algorithme présenté peuvent dépendre de l'implémentation spécifique et de l'algorithme comparé. Une analyse comparative complémentaire avec d'autres implémentations ou algorithmes peut être nécessaire.
L'approche est limitée aux grammaires sans contexte (CFG) et peut nécessiter des extensions pour gérer des grammaires plus complexes.
L’évaluation des performances et les résultats expérimentaux supplémentaires dans des scénarios d’application réels peuvent être limités.
👍