Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

LLMs Love Python: A Study of LLMs' Bias for Programming Languages and Libraries

Created by
  • Haebom
Category
Empty

저자

Lukas Twist, Jie M. Zhang, Mark Harman, Don Syme, Joost Noppen, Detlef Nauck

개요

본 논문은 대규모 언어 모델(LLM)이 코드 생성 시 프로그래밍 언어와 라이브러리를 선택하는 기준에 대한 최초의 심층 연구이다. 다양한 코딩 작업(벤치마크 및 새로운 프로젝트의 초기 구조 코드 생성 포함)을 통해 8개의 LLM을 평가한 결과, LLM은 언어에 구애받지 않는 문제 해결 시 파이썬을 90~97%의 비율로 선호하는 것으로 나타났다. 파이썬이 적합하지 않은 새로운 프로젝트 초기 코드 생성 작업에서도 58%의 비율로 파이썬을 사용했으며, 프로젝트 초기화 작업의 83%에서 LLM 자체의 언어 권장 사항과 상반되는 결과를 보였다. 또한, 기존 라이브러리에 대한 편향으로 인해 새로운 오픈소스 프로젝트의 발견 가능성에 심각한 문제가 발생할 수 있음을 지적했다. 결론적으로, 다양한 프로그래밍 환경에 대한 LLM의 적응성을 향상시키고 프로그래밍 언어 및 라이브러리 편향을 완화하기 위한 메커니즘을 개발해야 함을 강조한다.

시사점, 한계점

시사점:
LLM이 코드 생성 시 특정 언어(파이썬)에 대한 강한 편향을 가지고 있음을 밝힘.
LLM의 언어 선택 신뢰성에 대한 우려 제기.
LLM의 라이브러리 선택 편향이 새로운 오픈소스 프로젝트의 발견 가능성에 부정적 영향을 미침을 시사.
다양한 프로그래밍 환경에 대한 LLM의 적응성 향상 및 편향 완화 메커니즘 개발의 필요성 제기.
한계점:
연구에 사용된 LLM의 종류 및 수가 제한적일 수 있음.
평가에 사용된 코딩 작업의 다양성에 대한 추가적인 검토 필요.
LLM의 편향 완화를 위한 구체적인 해결책 제시 부족.
👍