本論文は,従来の逆反射的ランキング学習(CLTR)モデルの堅牢性を,広範なシミュレーションベースの実験を通して調査する。既存のシミュレーション研究のLimitations(弱い基準ランクモデルの使用、単純化されたユーザーシミュレーションモデルの使用、固定数の合成クリックログ生成)を改善するために、さまざまなパフォーマンスの基準ランクモデル、複数のユーザーシミュレーションモデル、およびさまざまな数の合成セッションを使用して実験を行います。実験の結果、IPS-DCM、DLA-PBM、UPE モデルは、他の CLTR モデルよりもさまざまなシミュレーション設定で優れた堅牢性を示しています。さらに、基準ランクモデルが強力であり、学習セッション数が制限されている場合、既存のCLTRモデルは単純なクリック基準モデルを上回らないことが多いことがわかりました。