Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Beyond Adapter Retrieval: Latent Geometry-Preserving Composition via Sparse Task Projection

Created by
  • Haebom

作者

Pengfei Jin, Peng Shu, Sifan Song, Sekeun Kim, Qing Xiao, Cheng Chen, Tianming Liu, Xiang Li, Quanzheng Li

概要

この論文は、パラメータ効率的な遷移学習で事前訓練されたモジュールライブラリからLoRAアダプタを設定する方法を提供します。従来のアプローチは、単純な検索ヒューリスティックまたは均一平均に依存して、表現空間における作業関係の潜在構造を見落とす限界がある。この論文では、アダプターの再利用のための新しいフレームワークを提案します。具体的には、基本モデルのエンコーダから派生した潜在円形ベクトルで各作業を表現し、ℓ1-正規化最適化目標の下で検索された参照円形の希少線形結合で対象作業円形を近似することを目標とします。その結果得られた結合重みは、対応するLoRAアダプタを混合するために使用され、ターゲットタスクに適合する複合アダプタを生成する。この式は、作業表現多様体の地域幾何学を保存するだけでなく、関連するアダプターの最小セットを選択して、解釈性と効率的な再利用を促進します。医療画像の分割、医療レポートの生成、画像合成など、さまざまなドメインでのこのアプローチの効果を示します。実験結果は、ゼロショットの一般化を改善するために、検索と潜在的な幾何学的認識最適化を組み合わせることの利点を強調しています。

Takeaways、Limitations

Takeaways:
従来の単純検索と平均ベースのLoRAアダプタ再利用方式の制限を克服
潜在的なジオメトリ情報を活用して、より正確で効率的なアダプタ構成が可能
希少線形結合により最小限の関連アダプタのみを選択して解析性と効率性を向上
さまざまなドメインでゼロショット一般化のパフォーマンスを向上させる
Limitations:
提案された方法の効果は、特定のデータセットとタスクに依存する可能性があります。
ℓ1 - 正規化最適化の計算コストが比較的高くなる可能性があります。
より多様なタスクとドメインに対する追加の実験が必要です。
👍