Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

KisMATH: Do LLMs Have Knowledge of Implicit Structures in Mathematical Reasoning?

Created by
  • Haebom

저자

Soumadeep Saha, Akshay Chaturvedi, Saptarshi Saha, Utpal Garain, Nicholas Asher

개요

본 논문은 대규모 언어 모델(LLM)의 추론 성능 향상에 기여하는 Chain-of-Thought(CoT)의 작동 메커니즘을 밝히기 위해 Causal CoT Graphs(CCGs)를 제시한다. CCGs는 LLM 출력에서 미세한 인과적 의존성을 모델링하는 방향성 비순환 그래프로, 추론 과정을 자동으로 추출한다. 논문에서는 MATH500, GSM8K, AIME의 수학적 추론 문제 1671개와 이에 해당하는 CCGs를 포함하는 KisMATH 데이터셋을 공개한다. 15개의 오픈 가중치 LLM을 이용한 실험 분석을 통해, CCG의 추론 노드가 최종 답변에 대한 매개체 역할을 하고, LLM이 CCG에 의해 주어진 추론 경로를 강조함을 보여준다. KisMATH는 그래프 정렬된 제어된 개입을 가능하게 하여 LLM 추론에서 CoT의 역할에 대한 추가 연구를 위한 길을 연다.

시사점, 한계점

시사점:
LLM의 추론 과정을 명확하게 분석하고 이해할 수 있는 새로운 프레임워크(CCGs)를 제공한다.
LLM이 CoT를 통해 추론하는 메커니즘에 대한 통찰력을 제공한다.
새로운 데이터셋 KisMATH를 통해 CoT에 대한 추가 연구를 위한 기반을 마련한다.
LLM의 내부 추론 구조에 대한 이해를 높인다.
한계점:
KisMATH 데이터셋이 수학적 추론 문제에만 국한되어 다른 유형의 추론 문제에 대한 일반화 가능성이 제한될 수 있다.
CCGs 추출 과정의 자동화 및 정확성에 대한 추가적인 연구가 필요할 수 있다.
분석에 사용된 LLM의 종류와 크기가 제한적일 수 있다.
👍