Sign In

Integrating Various Software Artifacts for Better LLM-based Bug Localization and Program Repair

Created by
  • Haebom
Category
Empty

저자

Qiong Feng, Xiaotian Ma, Jiayi Sheng, Ziyuan Feng, Wei Song, Peng Liang

개요

본 논문은 대규모 언어 모델(LLM) 기반 자동 프로그램 복구(APR) 기술의 한계를 극복하기 위해 다양한 소프트웨어 정보를 활용하는 새로운 방법인 DEVLoRe를 제안합니다. 기존 LLM 기반 APR 방법들은 단일 유형의 소프트웨어 정보에 의존하는 반면, DEVLoRe는 이슈 내용(설명 및 메시지), 스택 에러 추적, 디버그 정보를 통합하여 버그가 있는 메서드와 라인을 정확히 찾고, 단위 테스트를 통과하는 패치를 생성합니다. Defects4J v2.0 데이터셋을 사용한 실험 결과, DEVLoRe는 기존 최첨단 APR 방법들을 능가하는 성능을 보였습니다. 특히 이슈 내용이 LLM의 오류 위치 파악 및 프로그램 복구에 효과적임을 확인하였으며, 다양한 소프트웨어 정보의 상호 보완적인 효과를 입증했습니다. 소스 코드와 실험 결과는 공개 저장소(https://github.com/XYZboom/DEVLoRe)에서 확인할 수 있습니다.

시사점, 한계점

시사점:
다양한 소프트웨어 정보(이슈 내용, 스택 에러 추적, 디버그 정보)를 통합하여 LLM 기반 APR 성능 향상 가능성을 제시.
이슈 내용이 LLM 기반 APR에서 중요한 역할을 수행함을 실험적으로 증명.
기존 최첨단 APR 방법 대비 향상된 성능을 달성.
재현 가능성을 위해 소스 코드와 실험 결과를 공개.
한계점:
Defects4J v2.0 데이터셋에 대한 실험 결과만 제시되어 일반화 가능성에 대한 추가 검증 필요.
다양한 유형의 버그에 대한 적용성 및 성능 평가 추가 필요.
특정 데이터셋에 편향될 가능성 존재.
복잡한 버그 수정에 대한 성능은 추가 연구가 필요할 수 있음.
👍