Dan A. Calian, Gregory Farquhar, Iurii Kemaev, Luisa M. Zintgraf, Matteo Hessel, Jeremy Shar, Junhyuk Oh, Andras Gyorgy, Tom Schaul, Jeffrey Dean, Hado van Hasselt, David Silver
개요
본 논문은 파운데이션 모델의 훈련 데이터 품질이 중요하며, 데이터셋 큐레이션의 중요성을 강조합니다. 기존 방식의 한계를 극복하기 위해, 훈련에 가치 있는 데이터를 학습하는 메타 러닝 기반의 접근 방식인 DataRater를 제안합니다. DataRater는 메타 그래디언트를 사용하여 각 데이터 포인트의 가치를 추정하고, 이를 통해 데이터 필터링을 수행하여 훈련 효율성을 향상시키는 것을 목표로 합니다. 광범위한 실험을 통해 DataRater가 다양한 모델 규모와 데이터셋에서 컴퓨팅 효율성을 크게 향상시키는 것을 확인했습니다.