RQdiaは、ピクセルベースのディープエンハンスメント学習で拡張画像を使用してQ値分布を調整する新しい方法です。 MSEを使用した単純な補助損失関数を使用してQ値分布を均等にすることで、MuJoCo連続制御環境でDrQとSACの性能をそれぞれ12個の課題のうち9個と10個で向上させ、Atariアーケード環境でData-Efficient Rainbowの性能を26個の環境のうち18個で向上させます。改善されたパフォーマンスは、サンプル効率と長期学習の両方で確認されます。さらに、rQdiaを追加することで、ピクセルベースのモデルなしの連続制御がステータスエンコード基準モデルを上回りました。