Understanding LLMs' Fluid Intelligence Deficiency: An Analysis of the ARC Task
Created by
Haebom
Category
Empty
저자
Junjie Wu, Mo Yu, Lemao Liu, Dit-Yan Yeung, Jie Zhou
개요
본 논문은 대규모 언어 모델(LLM)이 다양한 자연어 처리 과제에서 우수한 성능을 보이지만, 이는 주로 LLM 매개변수에 인코딩된 방대한 지식을 활용하는 데 의존하며, 사전 지식 없이 새로운 문제를 해결하는 능력인 유체 지능에는 부족함을 보인다는 점을 지적한다. 연구에서는 대표적인 ARC 과제를 사용하여 LLM의 유체 지능 측정에서 나타나는 어려움을 분석하고, 기존 LLM의 세 가지 주요 한계점(기술 조합 능력의 제한, 추상적인 입력 형식에 대한 익숙하지 않음, 좌에서 우로 디코딩의 내재적 결함)을 밝혀낸다. 실험 데이터와 코드는 https://wujunjie1998.github.io/araoc-benchmark.github.io/ 에서 확인할 수 있다.