本論文は、既存の堅牢なアルゴリズム開発が具体的な分布変化の経験的検証なしに構造的仮定に依存する限界を指摘し、経験的に基づくデータ中心のアプローチを提案します。 8つの表形式データセット、172の分布ペア、45の方法論、90,000の方法論構成を含む経験的テストベッドを構築し、経験的リスク最小化(ERM)と分布的に堅牢な最適化(DRO)方法論を比較分析しました。分析は、従来のML文献で主に取り扱われているX(共変量)の変化とは異なり、Y | Xの変化が最も一般的であり、堅牢なアルゴリズムのパフォーマンスが一般的な方法より優れていないことを発見しました。 DRO方法論の詳細な分析により、モデルクラスやハイパーパラメータの選択などの実装の詳細は、不確実性のセットまたは半径よりもパフォーマンスに大きな影響を与えました。最後に、分布の変化のデータ中心的で帰納的な理解がアルゴリズム開発に新しいアプローチを提供できることをケーススタディを通して示しています。