Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Starjob: Dataset for LLM-Driven Job Shop Scheduling

Created by
  • Haebom

저자

Henrik Abgaryan, Tristan Cazenave, Ararat Harutyunyan

개요

본 논문은 대규모 언어 모델(LLM)을 조합 최적화 문제 해결에 적용하는 연구를 다룹니다. 특히, 작업장 스케줄링 문제(JSSP)에 초점을 맞춰, LLM 기반의 스케줄링 접근 방식을 제시합니다. 130,000개의 인스턴스로 구성된 새로운 JSSP용 지도 학습 데이터셋 Starjob을 제작하고, LLaMA 8B 모델을 LoRA 방법으로 미세 조정하여 end-to-end 스케줄링 모델을 개발했습니다. DMU와 Taillard 벤치마크에서 기존 우선순위 배정 규칙(PDR) 및 최첨단 신경망 방식인 L2D를 능가하는 성능을 보였습니다. 평균적으로 DMU에서 15.36%, Taillard에서 7.85%의 성능 향상을 달성했습니다. 이는 LLM이 조합 최적화 문제 해결에 큰 잠재력을 가지고 있음을 보여줍니다.

시사점, 한계점

시사점:
LLM을 조합 최적화 문제, 특히 JSSP에 적용하는 새로운 접근 방식을 제시.
기존 방법(PDR, L2D) 대비 성능 향상을 실험적으로 입증.
LLM 기반 조합 최적화 문제 해결의 가능성을 제시하고, 향후 연구 방향 제시.
JSSP를 위한 새로운 대규모 데이터셋 Starjob 공개.
한계점:
Starjob 데이터셋의 일반화 성능 및 다양성에 대한 추가적인 검증 필요.
LLM의 계산 비용 및 학습 비용 고려.
다른 조합 최적화 문제로의 일반화 가능성에 대한 추가 연구 필요.
LLM의 의사결정 과정에 대한 설명력 부족.
👍