本論文は、テキスト画像生成モデルの人間描写偏向性研究を超えて、物体自体に対する人口統計的偏向(例えば自動車)を調査します。 3つの最先端モデル(GPT Image-1、Imagen 4、Stable Diffusion)を使用して、5つのモノカテゴリにわたって2,700の画像を生成し、人口統計的手がかり(「若者のための」など)を使用した生成結果とニュートラルなプロンプトの結果を比較する新しいフレームワークであるSODA(Object)分析は、特定の人口統計集団と視覚的特性(性別や民族的手がかりによって引き起こされる繰り返しの色パターン)との間に強力な関連性があることを明らかにしました。これらのパターンは、よく知られた固定観念だけでなく、より微妙で直感的でない偏向も反映して強化します。さらに、いくつかのモデルは、多様性の低い出力を生成し、ニュートラルなプロンプトと比較したときに視覚的差を増幅することを観察した。提案された監査フレームワークは、今日の生成モデルに依然として固有の固定観念を明らかにする実用的な方法を提供し、より体系的で責任あるAI開発のための不可欠なステップとして提示します。