Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Data-driven inventory management for new products: An adjusted Dyna-$Q$ approach with transfer learning

Created by
  • Haebom

저자

Xinye Qu, Longxiao Liu, Wenjie Huang

개요

본 논문은 기존 수요 정보가 없는 신제품 재고 관리를 위한 새로운 강화 학습 알고리즘을 제안한다. Dyna-Q 구조를 기반으로 모델 기반 및 모델 자유 접근 방식을 균형 있게 활용하며, Dyna-Q의 학습 과정을 가속화하고 모델 기반 피드백으로 인한 모델 불일치를 완화한다. 전이 학습 개념을 활용하여 유사 제품의 수요 데이터를 활용, 초기 학습 안정화 및 최적 정책 추정의 분산을 줄인다. 제과점 재고 관리 실제 데이터를 활용한 사례 연구를 통해 알고리즘의 유효성을 검증하였으며, 조정된 Dyna-Q는 Q-learning에 비해 평균 일일 비용을 최대 23.7% 절감하고, 기존 Dyna-Q에 비해 동일 기간 내 학습 시간을 최대 77.5% 단축시켰다. 전이 학습을 적용한 조정된 Dyna-Q는 30일 테스트 기간 동안 모든 비교 알고리즘 중 가장 낮은 총 비용, 총 비용 분산 및 상대적으로 낮은 부족률을 보였다.

시사점, 한계점

시사점:
기존 수요 정보가 없는 신제품 재고 관리에 효과적인 강화 학습 알고리즘 제시
Dyna-Q 알고리즘의 학습 속도 개선 및 모델 불일치 완화
전이 학습을 통한 초기 학습 안정화 및 성능 향상
실제 데이터 기반 사례 연구를 통한 알고리즘의 실효성 검증
Q-learning 및 기존 Dyna-Q 대비 비용 절감 및 학습 시간 단축 효과 확인
한계점:
제과점 재고 관리라는 특정 분야에 대한 사례 연구만 제시되어 일반화 가능성에 대한 추가 연구 필요
전이 학습에 사용되는 유사 제품의 선정 기준 및 방법에 대한 상세한 설명 부족
알고리즘의 성능이 데이터의 특성에 얼마나 민감한지에 대한 분석 부족
다른 강화학습 알고리즘과의 비교 분석이 더욱 다양하고 심도 있게 이루어질 필요가 있음.
👍