Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Learning Like Humans: Advancing LLM Reasoning Capabilities via Adaptive Difficulty Curriculum Learning and Expert-Guided Self-Reformulation

Created by
  • Haebom

저자

Enci Zhang, Xingang Yan, Wei Lin, Tianxiang Zhang, Qianchun Lu

개요

본 논문은 대규모 언어 모델(LLM)의 복잡한 문제 해결 능력 향상을 위한 두 가지 새로운 전략, 적응적 난이도 커리큘럼 학습(ADCL)과 전문가 지도 자기 재구성(EGSR)을 제안합니다. ADCL은 모델의 능력 변화에 따라 난이도를 재평가하여 훈련 중 난이도 변화 문제를 해결하는 커리큘럼 학습 전략입니다. EGSR은 모방 학습과 순수 탐색 간의 간극을 메우는 강화 학습 전략으로, 모델이 전문가 솔루션을 직접 모방하는 대신 자신의 개념적 틀 내에서 재구성하도록 유도하여 더 깊은 이해와 지식 흡수를 촉진합니다. Qwen2.5-7B 모델을 기반으로 한 실험 결과, 두 전략은 상승적으로 성능을 향상시키며, AIME24 벤치마크에서 10%, AIME25 벤치마크에서 16.6%의 성능 향상을 보였습니다.

시사점, 한계점

시사점:
인간의 학습 전략을 모방한 새로운 학습 전략(ADCL, EGSR)을 통해 LLM의 복잡한 문제 해결 능력을 크게 향상시킬 수 있음을 보여줌.
ADCL과 EGSR의 결합이 기존 방법보다 훨씬 높은 성능 향상을 가져옴.
제시된 전략은 다양한 문제 해결 영역에 적용 가능성이 높음.
한계점:
제시된 전략의 효과는 특정 모델(Qwen2.5-7B)과 벤치마크(AIME24, AIME25)에 국한되어 일반화 가능성에 대한 추가 연구가 필요함.
ADCL의 난이도 재평가 방법 및 EGSR의 전문가 솔루션 재구성 과정에 대한 세부적인 설명이 부족하여 재현성에 대한 검토가 필요함.
다른 유형의 문제 또는 더 큰 모델에 대한 실험 결과가 제시되지 않아 범용성에 대한 추가적인 연구가 필요함.
👍