본 논문은 시간적 지능이 부족한 대규모 언어 모델(LLM)의 한계를 극복하기 위해, 30억 매개변수의 중간 크기 LLM에 포괄적인 시간적 능력(이해, 예측, 창의적 생성)을 부여하는 Time-R1 프레임워크를 제시한다. Time-R1은 정교하게 설계된 동적 규칙 기반 보상 시스템으로 구동되는 강화 학습(RL) 커리큘럼을 통해 (1) 기초적인 시간적 이해와 논리적 사건-시간 매핑, (2) 지식 차단선을 넘어서는 미래 사건 예측 기술, (3) 미세 조정 없이 창의적인 미래 시나리오 생성을 위한 일반화 능력을 단계적으로 구축한다. 실험 결과, Time-R1은 6710억 매개변수의 최첨단 DeepSeek-R1을 포함하여 훨씬 큰 모델들을 뛰어넘는 성능을 보였다. 또한, 10년간의 뉴스 데이터를 기반으로 한 대규모 다중 작업 시간적 추론 데이터셋인 Time-Bench와 Time-R1 체크포인트를 공개하여 추가 연구를 지원한다.