ETF: An Entity Tracing Framework for Hallucination Detection in Code Summaries
Created by
Haebom
저자
Kishan Maharaj, Vitobha Munigala, Srikanth G. Tamilselvam, Prince Kumar, Sayandeep Sen, Palani Kodeswaran, Abhijit Mishra, Pushpak Bhattacharyya
개요
본 논문은 대규모 언어 모델(LLM)을 이용한 코드 요약 과정에서 발생하는 환각(hallucination) 문제를 해결하기 위해 새로운 데이터셋 CodeSumEval(~10K samples)과 엔티티 추적 프레임워크(ETF)를 제안한다. CodeSumEval은 코드 요약 환각 검출을 위한 전용 데이터셋이며, ETF는 정적 프로그램 분석을 통해 코드 엔티티를 식별하고, LLM을 이용하여 생성된 코드 요약 내에서 이러한 엔티티와 의도를 매핑하고 검증한다. 실험 결과, ETF는 73%의 F1 점수를 달성하여 코드 요약의 정확성을 평가하고 요약 내 오류를 국한시키는 데 효과적임을 보였다.