Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

PARL-MT: Learning to Call Functions in Multi-Turn Conversation with Progress Awareness

Created by
  • Haebom

作者

Huacan Chai, Zijie Cao, Maolin Ran, Yingxuan Yang, Jianghao Lin, Xin Peng, Hairui Wang, Renjie Ding, Ziyu Wan, Muning Wen, Weiwen Liu, Weinan Zhang, Fei Huang, Ying Wen

PARL-MT: Progress Awareness for Multi-Turn Function Calling

概要

この論文では、旅行計画や多段階データ分析など、複数の会話で行われる実際のアプリケーションで大規模言語モデル(LLM)のパフォーマンスを向上させるために提案されたPARL-MTフレームワークについて説明します。 PARL-MTは、シングルターン機能呼び出しで画期的な成功を収めたLLMがマルチターン会話に直面する課題、特に進行状況認識能力、過去の対話要約能力、および長期的な作業を一貫して実行するための将来の計画能力を解決します。 PARL-MTは、進行状況認識をLLMトレーニングに明示的に統合し、進行状況認識生成(PAG)パイプラインを使用して、会話の要約と将来の作業計画を組み合わせたデータセットを自動的に構築し、進行状況認識誘導強化学習(PAG-RL)アルゴリズムを使用してコンテキストの冗長性を減らし、ローカルタスクと全体のタスク完了との整列を改善します。

Takeaways、Limitations

Takeaways:
進行状況認識を明示的にLLMトレーニングに組み込むことで、マルチターン機能呼び出しの効率と堅牢性を向上させます。
進行状況認識生成(PAG)パイプラインを使用して、会話の概要と将来の作業計画を含むデータセットを自動構築します。
進行状況認識誘導強化学習(PAG-RL)アルゴリズムにより、コンテキストの冗長性を減らし、地域作業とグローバル作業完了の間の整列を改善します。
2つのパブリックベンチマークで既存の方法を上回るパフォーマンスを示します。
Limitations:
本稿で直接言及されているLimitationsはありません。
👍