Sign In

Starjob: Dataset for LLM-Driven Job Shop Scheduling

Created by
  • Haebom
Category
Empty

저자

Henrik Abgaryan, Tristan Cazenave, Ararat Harutyunyan

개요

본 논문은 대규모 언어 모델(LLM)을 조합 최적화 문제 해결에 적용하는 가능성을 조사한 연구입니다. 특히, 작업장 스케줄링 문제(JSSP)에 초점을 맞춰, LLM 기반의 새로운 스케줄링 방법을 제시합니다. 13만 개의 인스턴스로 구성된 새로운 JSSP용 감독 학습 데이터셋 Starjob을 생성하고, LLaMA 8B 4-bit 양자화 모델을 LoRA 방법으로 미세 조정하여 end-to-end 스케줄링 접근 방식을 개발했습니다. 실험 결과, 기존 우선순위 배치 규칙(PDR) 및 최첨단 신경망 기반 접근 방식인 L2D보다 우수한 성능을 보였으며, DMU 벤치마크에서 15.36%, Taillard 벤치마크에서 7.85%의 평균 성능 향상을 달성했습니다. 이는 LLM이 조합 최적화 문제 해결에 잠재력이 있음을 보여줍니다.

시사점, 한계점

시사점:
LLM이 조합 최적화 문제, 특히 JSSP에 효과적으로 적용될 수 있음을 보여줌.
기존 PDR 및 최첨단 신경망 기반 방법보다 우수한 성능을 달성.
Starjob 데이터셋은 향후 LLM 기반 JSSP 연구에 중요한 자원이 될 것임.
LLM을 활용한 조합 최적화 문제 해결 분야의 새로운 가능성 제시.
한계점:
Starjob 데이터셋의 일반화 성능에 대한 추가적인 검증 필요.
특정 LLM과 훈련 방법에 대한 의존성 존재. 다른 LLM 및 훈련 방법에 대한 성능 비교 분석 필요.
대규모 LLM을 활용한 계산 비용 및 환경적 영향에 대한 고려 필요.
더욱 복잡하고 대규모의 JSSP 인스턴스에 대한 일반화 성능 평가 필요.
👍