Daily Arxiv

This page organizes papers related to artificial intelligence published around the world.
This page is summarized using Google Gemini and is operated on a non-profit basis.
The copyright of the paper belongs to the author and the relevant institution. When sharing, simply cite the source.

Co-PatcheR: Collaborative Software Patching with Component(s)-specific Small Reasoning Models

Created by
  • Haebom
Category
Empty

저자

Yuheng Tang, Hongwei Li, Kaijie Zhu, Michael Yang, Yangruibo Ding, Wenbo Guo

개요

Co-PatcheR는 소프트웨어 패칭 분야에서 일반적인 대규모 언어 모델(LLM)의 성공에 영감을 받아 개발된 시스템입니다. 기존 연구들이 단일 모델로 패칭 파이프라인 전체를 처리하려는 시도와 달리, Co-PatcheR는 협업적 특성을 활용하여 개별 구성 요소에 특화된 소규모 모델들을 활용합니다. 이 시스템은 문제 위치 파악, 패치 생성, 그리고 패치 검증을 위해 특별히 설계된 작업과 훈련 방식을 통해 구현되었습니다. Co-PatcheR는 3개의 140억 모델만을 사용하면서도 SWE-bench-Verified에서 46%의 해결률을 달성하여, 특화된 모델을 사용한 패칭 시스템 중 가장 우수한 성능을 보입니다.

시사점, 한계점

시사점:
협업적 시스템 설계를 통해 소규모 모델로도 높은 성능을 달성할 수 있음을 입증.
개별 작업에 특화된 모델과 훈련 방식의 중요성을 강조.
SWE-bench-Verified 데이터셋에서 기존 최고 성능을 능가.
훈련 리소스 및 모델 크기 측면에서 효율성을 보여줌.
한계점:
논문 자체에서 명시된 한계점은 없음.
SWE-bench-Verified 데이터셋에 국한된 성능 평가.
시스템의 일반화 가능성에 대한 추가적인 연구가 필요할 수 있음.
👍