본 논문은 머신러닝 모델의 성능이 데이터 분포 내 하위 집단(그룹) 간에 불균일한 문제를 해결하기 위한 새로운 접근법인 Group-robust Sample Reweighting (GSR)을 제안합니다. 기존 접근법들은 그룹별 최악의 손실을 최소화하기 위해 그룹 레이블이 있는 데이터를 사용하여 모델을 훈련하거나 하이퍼파라미터 튜닝을 수행하지만, 상당한 양의 고품질 레이블이 필요하다는 한계가 있습니다. GSR은 그룹 레이블이 없는 데이터의 가중치를 최적화하기 위해 그룹 레이블이 있는 데이터를 목표 집합으로 활용하는 새로운 패러다임을 제시합니다. 먼저 그룹 레이블이 없는 데이터로부터 표현을 학습하고, 영향 함수를 이용하여 재가중된 데이터로 모델의 마지막 레이어를 반복적으로 재훈련하여 모델을 개선합니다. 이론적으로 견고하고, 실제로는 경량이며, 하위 집단 변화에 대한 강건성을 향상시키는 데 효과적입니다. 특히, 동일하거나 더 많은 그룹 레이블을 필요로 하는 기존 최첨단 접근 방식보다 성능이 우수합니다.