본 논문은 밴딧 피드백을 갖는 조합적 다중 팔 밴딧(CMAB)에 대한 이중 기준 최적화를 연구합니다. 이 논문에서는 이산 이중 기준 오프라인 근사 알고리즘을 서브리니어 리그렛과 누적 제약 위반(CCV) 보장을 갖는 온라인 알고리즘으로 변환하는 일반적인 프레임워크를 제안합니다. 제안된 프레임워크는 오프라인 알고리즘이 $\delta$-복원력을 갖는 $(\alpha, \beta)$-이중 기준 근사 비율을 제공하고 목적 함수와 제약 함수를 평가하기 위해 $\texttt{N}$개의 오라클 호출을 사용해야 합니다. 본 논문에서는 제안된 프레임워크가 서브리니어 리그렛과 CCV를 달성하며, 두 경계 모두 ${O}\left(\delta^{2/3} \texttt{N}^{1/3}T^{2/3}\log^{1/3}(T)\right)$로 스케일링됨을 증명합니다. 중요하게도, 이 프레임워크는 $\delta$-복원력을 갖는 오프라인 알고리즘을 블랙 박스로 취급하여 기존 근사 알고리즘을 CMAB 설정에 유연하게 통합할 수 있게 합니다. 본 논문에서는 그 다양성을 보여주기 위해 서브모듈러 커버, 서브모듈러 비용 커버링 및 공정한 서브모듈러 최대화를 포함한 여러 조합 문제에 프레임워크를 적용합니다. 이러한 적용 사례는 오프라인 보장을 밴딧 피드백 하에서 온라인 이중 기준 최적화에 적용하는 프레임워크의 광범위한 유용성을 강조합니다.