Sign In

Graph-Attentive MAPPO for Dynamic Retail Pricing

Created by
  • Haebom
Category
Empty

저자

Krishna Kumar Neelakanta Pillai Santha Kumari Amma

개요

본 논문은 소매 가격 최적화를 위한 다중 에이전트 강화 학습(MARL) 연구를 제시한다. 실제 거래 데이터를 기반으로 시뮬레이션된 가격 책정 환경에서 강력한 MAPPO(Multi-Agent Proximal Policy Optimization) 모델과 제품 간의 상호 작용을 학습하는 그래프 어텐션(Graph Attention) 기반의 MAPPO+GAT 변형을 비교한다. 평가 프로토콜을 사용하여 이윤, 무작위 시드 간의 안정성, 제품 간의 공정성, 훈련 효율성을 평가하였다. 결과적으로 MAPPO는 포트폴리오 수준의 가격 관리에 대한 견고하고 재현 가능한 기반을 제공하며, MAPPO+GAT는 과도한 가격 변동성을 유발하지 않으면서 제품 그래프를 통해 정보를 공유하여 성능을 더욱 향상시키는 것으로 나타났다. 그래프 통합 MARL은 동적 소매 가격 책정을 위해 독립적인 학습자보다 더 확장 가능하고 안정적인 솔루션을 제공하며, 다중 제품 의사 결정에 실질적인 이점을 제공한다.

시사점, 한계점

시사점:
MAPPO는 소매 가격 최적화에 대한 강력하고 재현 가능한 기반을 제공한다.
MAPPO+GAT는 제품 간 상호 작용을 학습하여 성능을 향상시킨다.
그래프 통합 MARL은 다중 제품 가격 책정 문제에 확장 가능하고 안정적인 솔루션을 제공한다.
한계점:
해당 논문에서 구체적인 한계점은 명시되어 있지 않다. (논문의 요약 내용만으로는 한계점을 파악하기 어려움)
👍