Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Kodezi Chronos: A Debugging-First Language Model for Repository-Scale Code Understanding

Created by
  • Haebom

저자

Ishraq Khan, Assad Chowdary, Sharoz Haseeb, Urvish Patel, Yousuf Zaii

개요

Kodezi Chronos는 코드 디버깅에 특화된 새로운 언어 모델입니다. 기존의 대규모 언어 모델(LLM)들이 코드 합성에서는 높은 성능을 보이지만 실제 디버깅 작업에서는 성능이 낮다는 점을 해결하기 위해 개발되었습니다. Chronos는 최대 1천만 줄의 코드베이스를 탐색하는 적응형 그래프 기반 검색, 1천5백만 개 이상의 세션으로 훈련된 지속적인 디버그 메모리, 그리고 반복적인 수정-테스트-개선 루프를 위한 7계층 아키텍처를 결합합니다. 실제 5,000개의 시나리오에서 Claude나 GPT-4.1보다 월등히 높은 67.3%의 수정 정확도를 달성했으며, 디버깅 시간을 40%, 반복 횟수를 65% 줄였습니다. 복잡한 다중 파일 버그 및 여러 저장소 간의 맥락과 시간적 추론이 필요한 버그도 해결합니다. 2025년 4분기에 Kodezi OS에서, 2026년 1분기에 API를 통해 사용 가능할 예정입니다.

시사점, 한계점

시사점:
기존 LLM의 디버깅 성능 한계를 극복하여 실제 디버깅 작업에 효과적으로 적용 가능함을 보여줌.
대규모 코드베이스에서의 효율적인 버그 수정 및 디버깅 시간 단축 가능성 제시.
복잡한 다중 파일 버그 및 여러 저장소 간의 맥락을 고려한 디버깅 가능.
사용자 평가에서 기존 모델 대비 높은 선호도를 보임.
한계점:
하드웨어 종속적 문제(23.4% 성공률) 및 동적 언어 오류(41.2% 성공률) 해결에 어려움.
👍