本論文は、自己地図学習(SSL)における評価方式のLimitationsを指摘し、それを改善するための新しい評価フレームワークを提示します。既存の固定ベンチマークベースの評価は、AI研究の究極の目標である「すべての可能な作業を解決する」との違いを示しており、研究者がさまざまな評価課題を見つけるために多くの努力を払っています。そこで、この論文では、タスク分布と事前確率を導入して、可能なすべてのサブタスクの確率空間を定義します。これにより、モデルのすべての可能なサブタスクの平均パフォーマンスと分散を評価できます。これは、すべての可能なサブタスクでのモデルパフォーマンスを評価し、特に自己指導学習研究の進歩に貢献すると期待されています。