本論文は,大規模マルチモーダルモデルのオープン出力評価の難しさを解決するために,様々な作業と側面にわたる統合的な微粒子評価者UFEvalを提案した。 UFEvalは、自然言語生成、画像理解、画像生成、およびテキストと画像の交差生成など、4つのタスクにわたって112の細かい側面を含む階層的な側面分類スキームに基づいています。 64,000個のペア比較サンプルと325,000個の評価ラベルを含む微粒子評価データセットFRABenchを構築し、UFEvalを学習しました。実験の結果、特定の側面の学習が目に見えない側面への一般化を可能にし、さまざまなタスクと側面の共同学習が相互利益をもたらすことを示しています。