LlamaDuo: LLMOps Pipeline for Seamless Migration from Service LLMs to Small-Scale Local LLMs
Created by
Haebom
저자
Chansung Park, Juyong Jiang, Fan Wang, Sayak Paul, Jing Tang
개요
본 논문은 클라우드 기반의 독점적 대규모 언어 모델(LLM) 사용의 운영 의존성, 개인 정보 보호 문제, 지속적인 인터넷 연결 필요성과 같은 과제를 해결하기 위해, 서비스 지향적 LLM의 지식과 능력을 더 작고 로컬에서 관리 가능한 모델로 원활하게 마이그레이션하는 LLMOps 파이프라인인 "LlamaDuo"를 제시합니다. LlamaDuo는 서비스 LLM을 사용하여 생성된 합성 데이터셋을 사용하여 소규모 언어 모델을 미세 조정합니다. 미세 조정된 모델의 성능이 기대에 미치지 못하면, 서비스 LLM이 생성한 추가적인 유사 데이터를 사용하여 추가 미세 조정을 통해 자동으로 개선됩니다. 이러한 다단계 프로세스는 소규모 모델이 특정 다운스트림 작업에서 서비스 LLM의 기능과 일치하거나 능가할 수 있도록 보장하여 제약된 환경에서 AI 배포를 관리하기 위한 실용적이고 확장 가능한 솔루션을 제공합니다. 다양한 최첨단 LLM을 사용한 광범위한 실험을 통해 다양한 다운스트림 작업에서 LlamaDuo의 효과, 적응성 및 경제성을 입증합니다. 파이프라인 구현은 https://github.com/deep-diver/llamaduo 에서 확인할 수 있습니다.