본 논문은 기존의 구조화된 데이터에 의존하는 기계 학습 방법론으로는 활용되지 못하는 풍부한 시간적 환자 경과 정보를 담고 있는 임상 증례 보고서를 다룹니다. LLM 기반 주석 파이프라인을 통해 추출된 시간 기록이 있는 임상 소견을 주요 입력으로 사용하여 텍스트 시계열로부터 예측 문제를 제시합니다. 미세 조정된 디코더 기반 대규모 언어 모델과 인코더 기반 변환기 등 다양한 모델을 이벤트 발생 예측, 시간 순서, 생존 분석 작업에 대해 체계적으로 평가합니다. 실험 결과, 인코더 기반 모델이 단기 및 장기 예측에서 더 높은 F1 점수와 우수한 시간 일치도를 달성하는 반면, 미세 조정 마스킹 방식은 순위 성능을 향상시키는 것으로 나타났습니다. 반면, 지시어 미세 조정된 디코더 모델은 특히 조기 예후 설정에서 생존 분석에 상대적으로 유리한 것으로 나타났습니다. 추가적으로, 시간 순서가 중요함을 보여주는 감도 분석 결과를 제시하며, LLM의 고전적인 학습 방식인 텍스트 순서와 비교하여 임상 시계열 구성이 필요함을 강조합니다. 이는 시간 순서가 있는 말뭉치에서 얻을 수 있는 추가적인 이점을 강조하며, 광범위한 LLM 사용 시대의 시간적 작업에 대한 시사점을 제공합니다.