본 논문은 사전 훈련된 Transformer 모델의 계층별 시간 역동성(layer-time dynamics)이 인간의 실시간 처리 과정을 예측하는 데 있어 모델 출력 확률 분포 이상의 추가적인 예측력을 제공하는지 여부를 다섯 가지 연구를 통해 조사합니다. 인간의 오프라인 판단이나 실시간 처리와 같은 인간 인지 측정치를 모델 출력으로 예측하는 기존 접근 방식에서 나아가, 모델 내부 처리 과정 자체를 분석하여 인간과 모델의 처리 전략 유사성을 탐구합니다. 다양한 도메인과 모달리티에 걸쳐 진행된 연구 결과, Transformer 모델의 계층별 시간 역동성이 인간의 처리 과정을 더 잘 예측하는 것을 보여주며, 일반적인 목적(예: 다음 토큰 예측, 이미지 인식)을 통해 학습된 Transformer의 처리 과정과 인간의 처리 과정이 유사한 특성에 의해 촉진되거나 방해받을 수 있음을 시사합니다. 이는 AI 모델을 단순한 자극-반응 매핑이 아닌 명시적인 처리 모델로 활용하는 새로운 방법을 제시합니다.