本稿では、大規模言語モデル(LLM)を活用して合成表形式データを生成する新しい方法論であるTAGALを紹介します。 TAGALは、エージェントベースのワークフローを通じて繰り返しフィードバックプロセスを自動化し、追加のLLMトレーニングなしでデータ品質を向上させます。 LLMの活用により、外部の知識を生成プロセスに統合し、さまざまなデータセットと品質の観点からTAGALのパフォーマンスを評価します。合成データだけで分類器を訓練するか、実際のデータと合成データを組み合わせる方法で下流のMLモデルの有用性を分析し、実際のデータと生成されたデータの間の類似性を比較します。その結果、TAGALはLLMトレーニングが必要な最先端の技術と同等の性能を示し、訓練を必要としない他の技術よりも優れた性能を示します。これにより、エージェントベースのワークフローの可能性を強調し、LLMベースのデータ生成方法の新しい方向性を提供します。