Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Nash Equilibrium Constrained Auto-bidding With Bi-level Reinforcement Learning

Created by
  • Haebom
Category
Empty

저자

Zhiyu Mou, Miao Xu, Rongquan Bai, Zhuoran Yang, Chuan Yu, Jian Xu, Bo Zheng

개요

본 논문은 온라인 광고 플랫폼의 자동 입찰 알고리즘 문제를 다룹니다. 기존 알고리즘들이 플랫폼이 직면하는 문제를 정확히 포착하지 못한다는 점을 지적하며, 플랫폼은 각 광고주의 성과를 최대화하면서(ϵ-Nash Equilibrium 필요) 동시에 모든 광고주의 사회적 후생을 극대화해야 한다고 주장합니다. 이를 위해, 플랫폼 관점에서 자동 입찰 문제를 새롭게 정의한 Nash-Equilibrium Constrained Bidding (NCB)을 제시합니다. NCB는 ϵ-NE 제약 조건 하에서 모든 광고주의 사회적 후생을 극대화하는 것을 목표로 합니다. 이 문제의 어려움을 해결하기 위해, 이론적 보장을 갖춘 Bi-level Policy Gradient (BPG) 프레임워크를 제안합니다. BPG는 광고주 수와 무관한 계산 복잡도를 가지며, 기울기 계산이 간편합니다. 시뮬레이션 및 실제 환경 실험을 통해 BPG 프레임워크의 효과를 검증합니다.

시사점, 한계점

시사점:
플랫폼 관점에서 자동 입찰 문제를 새롭게 정의하고, ϵ-Nash Equilibrium을 고려한 NCB 문제 제시.
광고주 수와 무관한 계산 복잡도를 갖는 BPG 프레임워크 제안.
시뮬레이션 및 실제 환경 실험을 통해 BPG의 효과 검증.
한계점:
실제 환경 실험의 구체적인 데이터 및 설정에 대한 정보 부족.
BPG 프레임워크의 확장성 및 다양한 광고 형태에 대한 적용성에 대한 추가 연구 필요.
ϵ-NE의 ϵ 값 설정에 대한 논의 부족.
👍