Scattered Forest Search: Smarter Code Space Exploration with LLMs

작성자

Haebom

카테고리

Empty

저자

Jonathan Light, Yue Wu, Yiyou Sun, Wenchao Yu, Yanchi liu, Xujiang Zhao, Ziniu Hu, Haifeng Chen, Wei Cheng

개요

본 논문은 코드 생성을 코드 공간 내의 블랙박스 최적화 문제로 설정하고, 최적화 기법을 통해 추론 확장성을 향상시키는 방법을 제시합니다. 이 관점을 바탕으로, 해의 다양성을 개선하고 진화적 탐색 중 피드백을 더 잘 활용하는 새로운 접근 방식인 SCATTERED FOREST SEARCH (SFS)를 제안합니다. 이론적 분석을 통해 이러한 방법들이 최적화 과정에서 지역 최적점을 피하는 데 도움이 되어 더 효율적인 탐색을 가능하게 함을 보여줍니다. HumanEval, MBPP, APPS, CodeContests 및 Leetcode에 대한 광범위한 실험을 통해 상당한 성능 향상을 보였습니다. 예를 들어, HumanEval+에서 67.1%, HumanEval에서 87.2%의 pass@1 비율을 달성하여 기존 최고 성능보다 각각 8.6%와 4.3% 향상되었으며, 정답을 찾는 데 필요한 반복 횟수도 절반으로 줄였습니다. 또한, 트리 탐색, 선형 탐색 및 반복적 샘플링을 포함한 기존 탐색 기법보다 더 효율적으로 확장됩니다.

시사점, 한계점

•

시사점:

◦

코드 생성을 블랙박스 최적화 문제로 프레이밍하여 새로운 관점을 제시.

◦

SFS 알고리즘을 통해 기존 방법 대비 성능 향상 및 효율적인 탐색 달성.

◦

HumanEval, MBPP, APPS, CodeContests, Leetcode 등 다양한 벤치마크에서 성능 우수성 검증.

◦

지역 최적점 회피를 통한 최적화 효율 증대.

◦

기존 탐색 기법보다 효율적인 확장성.

•

한계점:

◦

논문에서 SFS 알고리즘의 구체적인 구현 세부 사항이 부족할 수 있음.

◦

다른 최적화 기법과의 비교 분석이 더욱 심도 있게 이루어질 필요가 있음.

◦

특정 벤치마크 데이터셋에 대한 의존성이 존재할 가능성.

◦

실제 대규모 코드 생성 문제에 대한 적용 가능성 및 일반화 성능에 대한 추가 연구 필요.

PDF 보기

Made with Slashpage