WizardCoder: Empowering Code Large Language Models with Evol-Instruct
Created by
Haebom
저자
Ziyang Luo, Can Xu, Pu Zhao, Qingfeng Sun, Xiubo Geng, Wenxiang Hu, Chongyang Tao, Jing Ma, Qingwei Lin, Daxin Jiang
개요
본 논문은 StarCoder와 같은 코드 대규모 언어 모델(Code LLMs)이 코드 관련 작업에서 뛰어난 성능을 보이지만, 대부분의 기존 모델은 지시어 미세 조정 없이 방대한 원시 코드 데이터로만 사전 훈련된다는 점을 지적합니다. 이에 연구진은 Evol-Instruct 방법을 코드 영역에 적용하여 복잡한 지시어 미세 조정으로 Code LLMs를 강화한 WizardCoder를 제시합니다. HumanEval, HumanEval+, MBPP, DS-1000 등 네 가지 주요 코드 생성 벤치마크에 대한 포괄적인 실험을 통해 WizardCoder의 탁월한 성능을 입증합니다. WizardCoder는 다른 모든 오픈소스 Code LLMs를 상당한 차이로 능가하며, HumanEval과 HumanEval+에서는 Anthropic의 Claude 및 Google의 Bard와 같은 가장 큰 폐쇄형 LLMs보다도 성능이 뛰어납니다. 코드, 모델 가중치 및 데이터는 https://github.com/nlpxucan/WizardLM 에서 공개됩니다.