Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Bandit Guided Submodular Curriculum for Adaptive Subset Selection

Created by
  • Haebom
Category
Empty

저자

Prateek Chanda, Prayas Agrawal, Saral Sureka, Lokesh Reddy Polu, Atharv Kshirsagar, Ganesh Ramakrishnan

개요

본 논문은 기존의 어려운 난이도 정의 문제를 해결하기 위해, 적응형 부분 집합 선택을 다중 팔 бандит 문제로 재해석하고, 각 팔이 샘플 선택을 안내하는 submodular function에 해당하는 ONLINESUBMOD라는 새로운 온라인 탐욕 정책을 제안한다. ONLINESUBMOD는 효용성 기반 보상을 최적화하며, 다양한 샘플링 방식에서 후회 없는 성능을 보장한다. 실험적으로, ONLINESUBMOD는 시각 및 언어 데이터 세트에서 기존의 curriculum learning 및 bi-level optimization 방식보다 우수한 정확도-효율성 트레이드오프를 보여준다.

시사점, 한계점

시사점:
난이도 정의의 어려움을 해결하기 위해 다중 팔 бандит 문제를 활용한 새로운 접근 방식 제시.
ONLINESUBMOD라는 새로운 온라인 탐욕 정책 제안 및 우수한 성능 입증.
validation-driven reward metrics를 사용하여 curriculum schedule을 안내하는 원리적인 방법 제시.
시각 및 언어 데이터셋에서 기존 방법론 대비 향상된 성능 입증.
한계점:
논문에서 구체적인 한계점 언급 없음. (Abstract 기반)
👍