제한된 계산 자원으로 인해 대부분의 대규모 언어 모델(LLM) 개발자들은 소규모 언어 모델(SLM)을 자체 데이터로만 미세 조정할 수 있습니다. 이러한 개인용 SLM은 일반적으로 효과가 제한적입니다. 본 논문에서는 개인용 SLM의 성능을 향상시키기 위해 일반적인 LLM의 도움을 요청하는 방법을 제안합니다. 일반적인 LLM은 개발자가 추론 비용을 감당할 수 있는 API 또는 더 큰 LLM일 수 있습니다. 구체적으로, 본 논문에서는 개인용 SLM이 프로세스 보상의 안내에 따라 일반적인 LLM과 적응적으로 공동 추론을 수행하는 G-Boost 프레임워크를 제안합니다. 실험 결과, 제안된 프레임워크가 개인용 SLM의 성능을 크게 향상시킬 수 있음을 보여줍니다.
시사점, 한계점
•
시사점: 제한된 자원을 가진 개발자들이 일반적인 LLM을 활용하여 개인용 SLM의 성능을 효과적으로 향상시킬 수 있는 새로운 방법을 제시합니다. G-Boost 프레임워크는 개인용 SLM의 실용성을 높이고 다양한 응용 분야에서의 활용 가능성을 확대합니다.
•
한계점: G-Boost 프레임워크의 성능 향상은 일반적인 LLM의 성능에 의존적입니다. 일반적인 LLM의 응답이 부정확하거나 비효율적인 경우, 성능 향상이 제한될 수 있습니다. 또한, 일반적인 LLM 사용에 따른 비용 문제가 고려되어야 합니다. 프레임워크의 최적 파라미터 설정에 대한 추가적인 연구가 필요할 수 있습니다.