[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Change of Thought: Adaptive Test-Time Computation

Created by
  • Haebom

作者

Mrinal Mathur, Mike Doan, Barak Pearlmutter, Sergey Plis

概要

この論文は、固定深さで評価されるトランスフォーマがTC0回路クラスの表現力に制限されることを証明し、これらの制限を克服するために自己反復方式ではなくエンコーダトランスフォーマの表現力を向上させる新しい方法を提示します。従来の自己反復方法は、中間状態をトークンにデコードして再エンコードするフィードバックループに依存しますが、この論文で提案されているSELF-Transformerは、エンコーダ層内でアテンション重みを固定点に反復的に改善し、入力困難に応じています。これは、単一パスで入力シーケンスを混合するソート行列を生成するのではなく、内部でその行列を繰り返し更新する方法です。その結果、パラメータ数を増やすことなく、エンコーダスタイルのベンチマークで最大20%の精度向上を達成し、テスト時に入力適応整列が少ない追加の演算コストでかなりの利点を提供します。したがって、SELF-Transformerは、純粋なエンコーダアーキテクチャの単純さを維持しながら、繰り返し推論の表現力をかなり部分的に回復します。

Takeaways、Limitations

Takeaways:
固定深さのTransformerの表現力限界を克服する新しい方法を提示します。
自己反復方式なしでエンコーダ変換器の表現力を向上。
試験時間における入力適応整列による精度向上と演算効率の向上
パラメータ数を増やすことなくパフォーマンス向上を達成。
純粋なエンコーダアーキテクチャの単純性を維持しながら反復推論の利点を確保
Limitations:
SELF-Transformerの効果がすべての種類のエンコーダベンチマークで同じように見えるかどうかは追加の実験が必要です。
入力困難に伴う試験時間計算量の増加に関する定量的分析と最適化計画の研究が必要
さまざまな種類のアーキテクチャや作業の一般化の可能性に関する追加の研究が必要です。
👍