CRPE: Expanding The Reasoning Capability of Large Language Model for Code Generation
Created by
Haebom
저자
Ningxin Gui, Qianghuai Jia, Feijun Jiang, Yuling Jiao, dechun wang, Jerry Zhijian Yang
개요
CRPE (Code Reasoning Process Enhancer)는 대규모 언어 모델(LLM)의 정교한 코드 추론 능력 개발을 발전시키는 3단계 프레임워크입니다. 기존 시스템-1 모델을 기반으로 코드 생성 작업에서 LLM의 분석 및 논리적 처리 능력 향상이라는 근본적인 과제를 해결합니다. CRPE는 언어 모델에서 고급 코드 추론 능력을 배양하기 위한 방법론적으로 엄격하지만 구현 가능한 접근 방식을 제시합니다. CRPE를 통해 향상된 COT-Coder를 개발하여 코드 생성 작업에서 눈에 띄는 성능 향상을 보였습니다. LiveCodeBench(20240701-20240901) 평가 결과, Qwen2.5-Coder-7B-Base를 기반으로 한 COT-Coder-7B-StepDPO는 pass@1 정확도 21.88로 유사하거나 더 큰 크기의 모든 모델을 능가했습니다. 또한 Qwen2.5-Coder-32B-Base를 기반으로 한 COT-Coder-32B-StepDPO는 pass@1 정확도 35.08로 GPT4O를 능가하는 우수한 성능을 보였습니다. 전반적으로 CRPE는 지침 데이터 획득부터 전문가 코드 추론 데이터 합성을 거쳐 자율적 추론 향상 메커니즘에 이르기까지 전체 파이프라인을 포함하는 포괄적인 오픈소스 방법입니다.
시사점, 한계점
•
시사점:
◦
LLM의 코드 추론 능력 향상을 위한 효과적인 3단계 프레임워크(CRPE) 제시.
◦
기존 모델 대비 향상된 코드 생성 성능을 보이는 COT-Coder 개발 성공.
◦
LiveCodeBench에서 GPT4O를 포함한 다른 모델들을 능가하는 성능 달성.
◦
전체 파이프라인을 포함하는 오픈소스 접근 방식 제공.
•
한계점:
◦
LiveCodeBench의 특정 기간(20240701-20240901) 데이터만 사용한 평가. 다른 기간 또는 다른 벤치마크에서의 성능은 추가 검증 필요.
◦
CRPE 프레임워크의 일반화 가능성 및 다른 LLM에 대한 적용성에 대한 추가 연구 필요.
◦
구체적인 프레임워크의 각 단계에 대한 세부적인 설명 부족. (논문에 더 자세한 설명이 필요)