Sign In

LLM Based Long Code Translation using Identifier Replacement

Created by
  • Haebom
Category
Empty

저자

Manojit Chakraborty, Madhusudan Ghosh, Rishabh Gupta

개요

소프트웨어 개발 분야에서, LLM을 활용하여 코드 번역과 같은 작업을 자동화하려는 시도가 이루어지고 있다. 하지만 LLM은 컨텍스트 창에 맞지 않는 긴 소스 코드에 취약하여 부정확한 번역 결과를 생성한다. 본 논문에서는 긴 식별자를 일반화된 자리 표시자로 대체하는 새로운 제로샷 코드 번역 방법을 제안한다. 이 방법을 통해 LLM은 코드의 논리적 구조에 집중할 수 있으며, 토큰 수와 메모리 사용량을 줄여 긴 코드 번역의 효율성과 비용 효율성을 향상시킨다. 실험 결과, 제안하는 방법은 구문 및 계층적 정보를 유지하면서 토큰 수를 줄인 번역 결과를 생성하는 것으로 나타났다.

시사점, 한계점

긴 코드 번역 문제 해결을 위한 새로운 제로샷 코드 번역 방법 제시
식별자 대체 기법을 통해 LLM의 효율성과 비용 효율성 향상
구문 및 계층적 정보 보존 및 토큰 수 감소 효과 입증
구체적인 한계점은 논문에 명시되지 않음
👍