Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

CogAtom: From Cognitive Atoms to Olympiad-level Mathematical Reasoning in Large Language Models

Created by
  • Haebom

저자

Zhuofan Chen, Jiyuan He, Yichi Zhang, Xing Hu, Haoxing Wen, Jun Bai, Wenge Rong

개요

CogAtom은 대규모 언어 모델(LLM)의 수학적 추론 능력 향상을 위한 새로운 문제 생성 프레임워크입니다. 기존의 방법과 달리, CogAtom은 인간이 작성한 해답에서 추출한 기본 추론 단위인 '인지 원자(cognitive atom)'를 선택하고 재결합하여 문제를 생성합니다. 다양성을 증진하는 랜덤 워크 알고리즘과 제약 기반 재결합 메커니즘을 통해 논리적 정합성과 구조적 타당성을 보장하며, 인지 원자의 수를 조절하여 문제의 난이도를 정밀하게 조절할 수 있습니다. 실험 결과, CogAtom은 기존 방법보다 정확도, 추론 깊이, 다양성 면에서 우수하며, AIME 수준의 난이도에 근접하면서도 구조적 변이 측면에서는 뛰어난 문제를 생성하는 것으로 나타났습니다. GitHub에서 공개적으로 코드를 이용할 수 있습니다.

시사점, 한계점

시사점:
LLM의 수학적 추론 능력 향상을 위한 새로운 접근법 제시
고품질 수학 문제의 대규모 생성 가능성 증명
문제의 난이도를 정밀하게 제어 가능
생성된 문제의 다양성 확보
인지 원자 기반의 접근 방식을 통해 문제 생성 과정의 투명성 향상
한계점:
인지 원자의 추출 및 정의에 대한 주관성 존재 가능성
현재는 AIME 수준의 문제 생성에 초점, 더 높은 수준의 문제 생성에 대한 추가 연구 필요
다양한 유형의 수학 문제에 대한 적용 가능성에 대한 추가 검증 필요
👍