本論文では、感情認識分野で高品質で多様な感情データセット不足の問題を解決するために、大規模言語モデル(LLM)を用いた新しい感情豊かなテキスト生成フレームワークであるPersonaGenを紹介します。 PersonaGenは、人口統計的属性、社会文化的背景、詳細な状況的文脈を組み合わせて階層化された仮想ペルソナを構成し、それによって感情表現の生成を誘導します。クラスタリングと分布メトリックによる意味多様性の評価、LLMベースの品質スコアによる人間の類似性の評価、実際の感情の束との比較による現実性の評価、下流の感情分類作業における実用性の評価など、包括的な評価を行います。実験の結果、PersonaGenは多様で一貫性があり、差別的な感情表現を生成する際の基準方法を大幅に上回り、実際の感情データセットを補完または置き換えるための強力な選択肢としての可能性を示しています。