본 논문은 대규모 언어 모델(LLM)의 그래프 관련 작업 능력의 한계를 극복하기 위해 강화 학습(RL) 기반의 새로운 접근법 G1을 제시합니다. 기존의 사전 학습 방식이나 지도 학습 방식은 대규모의 보편적으로 표현된 그래프 데이터 부족 문제에 직면했지만, G1은 다양한 난이도의 50가지 그래프 이론적 작업을 포함하는 대규모 합성 데이터셋 Erdős를 활용하여 RL 학습을 수행합니다. G1은 30억 매개변수 모델에서도 Qwen2.5-72B-Instruct 모델(24배 크기)을 능가하는 그래프 추론 성능 향상을 보여주며, 새로운 작업, 도메인 및 그래프 인코딩 방식에 대한 제로샷 일반화 능력도 우수함을 입증합니다. 이는 사전 학습된 LLM의 능력과 풍부한 자동 생성 합성 데이터를 결합하여 효율적이고 확장 가능한 강력한 그래프 추론 모델 구축 경로를 제시합니다.