Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Better by Comparison: Retrieval-Augmented Contrastive Reasoning for Automatic Prompt Optimization

Created by
  • Haebom

作者

Juhyeon Lee, Wonduk Seo, Hyunjin An, Seunghyun Lee, Yi Bu

概要

本稿では、大規模言語モデル(LLM)のプロンプトを最適化するための新しいフレームワークであるContrastive Reasoning Prompt Optimization(CRPO)を紹介します。 CRPOは、LLMの固有の推論能力を利用して、対照的な例から学習するretrieval-augmented reasoningプロセスでプロンプト最適化を実行します。 HelpSteer2データセットを活用して、高品質と低品質のプロンプト - 応答ペアを照合し、tiered contrastive reasoningとmulti-metric contrastive reasoningを介してLLMに独自のプロンプトを改善させる。実験の結果、CRPOは従来の方法論よりも優れた性能を示した。

Takeaways、Limitations

Takeaways:
LLMの推論能力を活用した新しいプロンプト最適化アプローチの提示
対照的な例示学習により、より堅牢で解釈可能な最適化を実現
HelpSteer2データセットを活用した実験によるパフォーマンス検証
Retrieval-augmented reasoningをプロンプト最適化に効果的に適用
Limitations:
HelpSteer2 データセット依存性
Tiered/multi-metric contrastive reasoningの詳細な実装方法の追加の説明の欠如の可能性
他のLLMモデルとデータセットの一般化可能性検証が必要
👍