[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Flexible and Efficient Grammar-Constrained Decoding

Created by
  • Haebom

作者

Kanghee Park, Timothy Zhou, Loris D'Antoni

概要

この論文は、大規模言語モデル(LLM)がコードスニペットやフォーマットされたデータなど、正確な構文規則に準拠した構造化出力を生成することを可能にするという問題について説明します。文法制約復号化(GCD)は、指定された文脈自由文法(CFG)に属さない出力につながるトークンをマスクし、LLM出力がこれらの規則と一致することを保証します。従来のGCDアルゴリズムは、サウンドネスを保証するために、LLMサブワードトークナイザーが特定のCFGのトークンとどのように整列するかを計算し、この情報に基づいてトークンマスクを計算する必要があり、これは非常に非効率的です。本論文は、従来のアプローチよりも17.71倍速いオフライン前処理を提供しながら、オンラインマスク計算の最先端の効率を維持する新しいGCDアルゴリズムと実装を提示します。

Takeaways、Limitations

Takeaways:
従来のGCDアルゴリズムの主なボトルネックであるオフライン前処理時間を大幅に短縮(17.71倍向上)し、LLMを利用した構造化データ生成の実用性を高めました。
オンラインマスク計算の効率は維持しながら前処理速度を改善し,リアルタイム応用に適したGCDアルゴリズムを提供する。
Limitations:
提示されたアルゴリズムの性能向上は、特定の実装および比較対象のアルゴリズムに依存し得る。
文脈自由文法(CFG)に限定されたアプローチでは、より複雑な文法を処理するための拡張が必要になる場合があります。
実際のアプリケーションシナリオでのパフォーマンス評価と追加の実験結果は限られている可能性があります。
👍