本稿では、目標指向のオープンな会話のために、大規模言語モデル(LLM)と強化学習ベースの会話マネージャを統合する新しいフレームワークを提案します。階層的強化学習を活用して会話の構造的段階をモデル化し、メタラーニングを通じてさまざまなユーザープロファイルへの適応力を向上させることで、限られたデータで学習し、会話段階間をスムーズに切り替え、異質なユーザーニーズに合わせてレスポンスをパーソナライズできます。モチベーションインタビューにこのフレームワークを適用して行動の変化を促進し、提案された会話マネージャが報酬の観点から最先端のLLM基準モデルよりも優れていることを示すことで、特定の目標を持つオープンな会話システムを作成するためのLLM条件化の潜在的な利点を実証します。