Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Kodezi Chronos: A Debugging-First Language Model for Repository-Scale Code Understanding

Created by
  • Haebom
Category
Empty

저자

Ishraq Khan, Assad Chowdary, Sharoz Haseeb, Urvish Patel, Yousuf Zaii

개요

Kodezi Chronos는 코드 생성 및 소프트웨어 자동화 분야에서 한계를 보이는 기존 대규모 언어 모델(LLM)의 디버깅 문제를 해결하기 위해 개발된 디버깅 특화 언어 모델입니다. 최대 1,000만 라인 규모의 코드베이스를 탐색하는 적응형 그래프 안내 검색(Adaptive Graph-Guided Retrieval), 1,500만 세션 이상에서 학습된 영구 디버그 메모리(Persistent Debug Memory), 7단계 수정-테스트-개선 아키텍처를 통합합니다. 5,000개의 실제 시나리오에서 67.3%의 수정 정확도를 달성하여 Claude 4.1 Opus (14.2%) 및 GPT-4.1 (13.8%)을 능가하며, SWE-bench Lite에서 80.33%의 해결률을 기록합니다. 디버깅 시간을 40%, 반복 횟수를 65% 감소시켰습니다.

시사점, 한계점

시사점:
실제 디버깅 작업에서 기존 LLM보다 월등한 성능을 보임 (67.3% 수정 정확도).
SWE-bench Lite에서 SOTA 달성 (80.33% 해결률).
복잡한 멀티 파일 및 크로스 레포지토리 버그 해결 능력.
디버깅 시간 및 반복 횟수 감소 (각각 40%, 65%).
한계점:
하드웨어 종속적 오류 및 동적 언어 오류 처리의 한계.
👍