Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

ACING: Actor-Critic for Instruction Learning in Black-Box LLMs

Created by
  • Haebom

作者

Salma Kharrat, Fares Fourati, Marco Canini

概要

この論文では、大規模言語モデル(LLM)のパフォーマンスを向上させるための自動化されたプロンプト最適化技術であるACINGを紹介します。 LLMのパラメータとグラデーションにアクセスできないブラックボックス環境でも機能する強化学習ベースのフレームワークであるACINGは、ステートレスな連続行動問題でプロンプト最適化を定式化し、無限のプロンプトスペースを探索します。実験の結果、ACINGはさまざまな作業(instruction-induction、要約、事故連鎖推論)で人間が作成したプロンプトよりも性能に優れたプロンプトを76%の割合で生成し、最高の自動化基準モデルに対して最大33点、中間値で10点の性能向上を示しました。広範なさらなる実験により、ACINGの堅牢性と効率を確認した。ソースコードはFitHubで公開されています。

Takeaways、Limitations

Takeaways:
ブラックボックスLLMのための効果的なプロンプト最適化技術を提示します。
人間が書いたプロンプトを上回るプロンプト自動生成の可能性を証明。
さまざまなLLMタスクに適用可能な一般的なフレームワークの提示。
ACINGのソースコード開示による再現性と活用性の向上
Limitations:
特定のLLMとジョブの一般化パフォーマンス検証が必要です。
ACINGの計算コストと学習時間の追加分析が必要
さまざまな種類のブラックボックスLLMの適用範囲とパフォーマンスの違いに関する追加の研究が必要です。
👍