Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Algorithmic Language Models with Neurally Compiled Libraries

Created by
  • Haebom

저자

Lucas Saldyt, Subbarao Kambhampati

개요

본 논문은 추론 및 계획과 같은 중요한 작업이 근본적으로 알고리즘적이라는 점을 강조하며, 이를 견고하게 해결하려면 지름길이 아닌 진정한 추론 또는 계획 알고리즘을 습득해야 함을 주장합니다. 대규모 언어 모델(LLM)은 신경망 최적화 알고리즘, 최적화 데이터 및 목표, 그리고 구조적 비표현성의 한계 때문에 진정한 알고리즘 능력이 부족합니다. 이를 해결하기 위해 본 논문은 기본 연산과 정교한 미분 가능 프로그램 라이브러리를 LLM에 추가하여 일반적인 알고리즘을 처음부터 학습할 필요가 없도록 제안합니다. LLaMA3 기반의 Transformer 구조에 메모리, 레지스터, 기본 연산 및 적응형 순환을 추가하고, 알고리즘을 미분 가능한 시작 라이브러리로 직접 컴파일하는 방법을 정의하여 기본적으로 사용하고 최적화를 위해 기울기를 전파합니다. 예비 연구에서는 가변적인 계산 깊이를 가진 간단한 알고리즘 작업에 대해 소규모 Transformer를 미세 조정함으로써 미분 가능한 컴퓨터로 LLaMA3를 확장하는 가능성을 탐구합니다.

시사점, 한계점

시사점: LLM의 알고리즘적 능력 제한을 극복하기 위한 새로운 접근법 제시. 미분 가능한 컴퓨터를 LLM에 통합하여 알고리즘을 직접 컴파일하고 최적화하는 방법 제안. LLaMA3와 같은 기존 모델을 개선하여 더욱 강력한 추론 및 계획 능력을 부여할 가능성을 보여줌.
한계점: 현재는 예비 연구 단계이며, 간단한 알고리즘 작업에 대한 결과만 제시됨. 복잡한 알고리즘이나 실제 세계 문제에 대한 적용 가능성은 추가 연구가 필요함. 미분 가능한 컴퓨터의 확장성 및 효율성에 대한 평가가 부족함.
👍