본 논문은 의료 과제 지원을 위한 유망한 도구로 떠오른 대규모 언어 모델(LLM)이 전자 건강 기록(EHR)의 시계열적 특성으로 인해 처리에 어려움을 겪는다는 점을 지적합니다. 기존 LLM의 의료 과제 수행 능력 향상에도 불구하고, 여러 환자 방문과 시간 범위에 걸친 시간적 의존성에 대한 추론 능력은 아직 탐구되지 않았습니다. 이에 본 논문에서는 환자 기록의 여러 부분에 근거한 지시-응답 쌍을 지시 평가와 시계열 임상 기록을 위한 조정의 중요한 차원으로 통합하는 프레임워크인 TIMER(Temporal Instruction Modeling and Evaluation for Longitudinal Clinical Records)를 제시합니다. 또한, 시계열 EHR에 대한 시간적 추론 능력을 평가하는 최초의 시간 인식 벤치마크인 TIMER-Bench와 LLM이 시간에 따른 추론을 학습하도록 하는 지시 조정 방법론인 TIMER-Instruct를 개발했습니다. 실험 결과, TIMER-Instruct로 미세 조정된 모델은 사람이 생성한 벤치마크에서 7.3%, TIMER-Bench에서 9.2% 성능이 향상되어 시간적 지시 조정이 EHR에 대한 추론 모델 성능을 향상시킨다는 것을 보여줍니다.