Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

code_transformed: The Influence of Large Language Models on Code

Created by
  • Haebom

저자

Yuliang Xu, Siming Huang, Mingmeng Geng, Yao Wan, Xuanhua Shi, Dongping Chen

개요

본 논문은 대규모 언어 모델(LLM)이 코드 스타일 변화에 미치는 영향을 최초로 대규모 실증 연구한 결과를 제시합니다. 2020년부터 2025년까지 발표된 arXiv 논문과 연결된 19,000개 이상의 GitHub 저장소의 코드를 분석하여 LLM 생성 코드의 특징과 일치하는 코딩 스타일 변화 추세를 확인했습니다. 예를 들어, Python 코드에서 snakecase 변수 이름의 비율이 2023년 1분기 47%에서 2025년 1분기 51%로 증가했습니다. 또한, LLM이 알고리즘 문제에 접근하는 방식을 분석하여 그 추론 과정을 조사했습니다. LLM의 다양성과 사용 시나리오 등의 요인으로 인해 LLM에 의해 생성되거나 지원된 코드의 비율을 정확하게 추정하는 것은 어렵거나 불가능하지만, 실험 결과는 LLM이 실제 프로그래밍 스타일에 영향을 미친다는 최초의 대규모 경험적 증거를 제공합니다.

시사점, 한계점

시사점:
LLM이 실제 세계의 프로그래밍 스타일에 영향을 미친다는 최초의 대규모 경험적 증거 제시.
LLM 사용에 따른 코드 스타일 변화 추세(예: snake_case 사용 증가)를 정량적으로 측정.
LLM의 알고리즘 문제 해결 접근 방식에 대한 통찰력 제공.
한계점:
LLM에 의해 생성되거나 지원된 코드의 비율을 정확하게 추정하는 것이 어려움.
LLM의 다양성과 사용 시나리오 등 다양한 요인을 완벽히 고려하지 못할 수 있음.
👍