[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

APIGen-MT: Agentic Pipeline for Multi-Turn Data Generation via Simulated Agent-Human Interplay

Created by
  • Haebom

作者

Akshara Prabhakar, Zuxin Liu, Ming Zhu, Jianguo Zhang, Tulika Awalgaonkar, Shiyu Wang, Zhiwei Liu, Haolin Chen, Thai Hoang, Juan Carlos Niebles, Shelby Heinecke, Weiran Yao, Huan Wang, Silvio Savarese, Caiming

概要

本論文は、多重相互作用のための効果的なAIエージェントトレーニングのための高品質データ生成のための新しいフレームワークであるAPIGen-MTを提示します。 APIGen-MTは、LLMレビューアと反復フィードバックループを活用して正確な作業青写真を生成するエージェントパイプラインと、シミュレートされた人とエージェントの相互作用を介して完全な相互作用経路を生成する2つのステップで構成されています。これにより生成されたデータを使用して訓練されたxLAM-2-fc-rモデルシリーズ(10億〜700億パラメータ)は、GPT-4oやClaude 3.5などの最先端のモデルを$ \ tau $ - benchおよびBFCLベンチマークよりも上回り、特に多重設定ではより小さいモデルがより大きいモデルより優れた性能を示しました。本論文では、5,000の合成データパスと訓練されたxLAM-2-fc-rモデルをオープンソースで公開し、AIエージェントの研究発展に貢献します。

Takeaways、Limitations

Takeaways:
高品質多重相互作用データを生成するための効果的なフレームワーク(APIGen-MT)の提示。
従来の最先端モデルを凌駕する性能を示すXLAM-2-fc-rモデルシリーズ開発。
多重車設定における小型モデルの優れた性能確認
5,000の合成データと訓練されたモデルのオープンソース公開による研究開発の貢献。
Limitations:
シミュレートされたデータの現実世界データとの違いの明確な検証の欠如。
LLMレビュー担当者の依存度が高く、レビュー担当者の偏りが結果に影響を与える可能性があります。
ベンチマーク評価の制限により、実際のアプリケーション環境でのパフォーマンスを完全に反映できない可能性があります。
👍