본 논문은 대규모 언어 모델(LLM) 기반 의사결정 시스템의 특정 분야 적용에 있어 도메인 특화 데이터 부족 문제를 해결하기 위해, 모델 재훈련 없이 동작하는 보상 없는 자기 지도 학습 프레임워크인 Retrial-Augmented Learning (RAL)을 제시합니다. RAL은 Retrieval-Augmented Generation (RAG)을 활용하여 가설 제안, 가설 검증, 지식 생성의 3단계 자율적 지식 생성을 구현합니다. LLM-PySC2 환경에서 평가한 결과, 환각을 효과적으로 줄이고 의사결정 성능을 극도로 낮은 비용으로 향상시키는 것을 보여줍니다. 또한 OOD(Out-of-Distribution) 작업, 강건성 및 전이성에서도 잠재력을 보이며, 의사결정 문제와 자율적 지식 생성에 대한 비용 효율적이고 효과적인 솔루션을 제공합니다.
시사점, 한계점
•
시사점:
◦
LLM 기반 의사결정 시스템의 도메인 특화 데이터 부족 문제에 대한 효과적인 해결책 제시
◦
모델 재훈련 없이도 성능 향상 가능
◦
환각 감소 및 의사결정 성능 향상
◦
OOD 작업, 강건성 및 전이성에서 우수한 성능
◦
비용 효율적인 자율적 지식 생성 가능성 제시
•
한계점:
◦
LLM-PySC2 환경에서만 평가되어 다른 환경에서의 일반화 가능성에 대한 추가 연구 필요