Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Bi-Criteria Optimization for Combinatorial Bandits: Sublinear Regret and Constraint Violation under Bandit Feedback

Created by
  • Haebom
Category
Empty

저자

Vaneet Aggarwal, Shweta Jain, Subham Pokhriyal, Christopher John Quinn

개요

본 논문은 밴딧 피드백을 갖는 조합적 다중 팔 밴딧(CMAB)에 대한 이중 기준 최적화를 연구합니다. 이 논문에서는 이산 이중 기준 오프라인 근사 알고리즘을 서브리니어 리그렛과 누적 제약 위반(CCV) 보장을 갖는 온라인 알고리즘으로 변환하는 일반적인 프레임워크를 제안합니다. 제안된 프레임워크는 오프라인 알고리즘이 $\delta$-복원력을 갖는 $(\alpha, \beta)$-이중 기준 근사 비율을 제공하고 목적 함수와 제약 함수를 평가하기 위해 $\texttt{N}$개의 오라클 호출을 사용해야 합니다. 본 논문에서는 제안된 프레임워크가 서브리니어 리그렛과 CCV를 달성하며, 두 경계 모두 ${O}\left(\delta^{2/3} \texttt{N}^{1/3}T^{2/3}\log^{1/3}(T)\right)$로 스케일링됨을 증명합니다. 중요하게도, 이 프레임워크는 $\delta$-복원력을 갖는 오프라인 알고리즘을 블랙 박스로 취급하여 기존 근사 알고리즘을 CMAB 설정에 유연하게 통합할 수 있게 합니다. 본 논문에서는 그 다양성을 보여주기 위해 서브모듈러 커버, 서브모듈러 비용 커버링 및 공정한 서브모듈러 최대화를 포함한 여러 조합 문제에 프레임워크를 적용합니다. 이러한 적용 사례는 오프라인 보장을 밴딧 피드백 하에서 온라인 이중 기준 최적화에 적용하는 프레임워크의 광범위한 유용성을 강조합니다.

시사점, 한계점

시사점:
오프라인 이중 기준 근사 알고리즘을 온라인 CMAB 설정으로 효율적으로 변환하는 일반적인 프레임워크를 제공합니다.
서브리니어 리그렛과 CCV에 대한 이론적 보장을 제공합니다.
다양한 조합 문제(서브모듈러 커버, 서브모듈러 비용 커버링, 공정한 서브모듈러 최대화 등)에 적용 가능한 유연성을 갖습니다.
기존의 오프라인 근사 알고리즘을 활용하여 새로운 온라인 알고리즘을 쉽게 개발할 수 있도록 합니다.
한계점:
${O}\left(\delta^{2/3} \texttt{N}^{1/3}T^{2/3}\log^{1/3}(T)\right)$ 의 복잡도는 $T$ (시간)에 따라 여전히 증가합니다. 더욱 개선된 복잡도를 갖는 알고리즘 개발이 필요할 수 있습니다.
$\delta$-복원력을 갖는 오프라인 알고리즘의 존재에 의존하므로, 모든 조합 문제에 적용 가능하지 않을 수 있습니다. 적용 가능한 문제의 범위를 확장하는 연구가 필요합니다.
실제 데이터셋에 대한 실험적 분석이 부족합니다. 실제 응용에서의 성능 평가가 필요합니다.
👍