시간 제약 조건 하에서 실시간 의사 결정을 필요로 하는 에이전트 아키텍처에서 LLM의 배포 시, 액션 윈도우의 개방 여부를 LLM이 신뢰성 있게 판단한다는 가정이 검증되지 않았음을 지적한다. 8개의 프로덕션 규모 모델(2.8-8B 파라미터)을 사용하여 마감일 감지 작업을 통해 시간 제약 조건 처리를 특성화한 결과, 이중 모드 성능 분포, 극심한 프롬프트 취약성, 체계적인 액션 편향과 같은 체계적인 배포 위험이 드러났다. 파라미터 수는 해당 범위 내에서 능력과 상관관계가 없었으며, 미세 조정이 부분적인 능력을 가진 모델의 성능을 향상시켰다. 자연어 다음 토큰 예측을 통해 시간 제약 조건 만족을 신뢰성 있게 학습할 수 없음을 보였고, 이는 지속적인 시간 상태 표현, 언어 패턴 매칭과 분리된 명시적 제약 조건 확인, 시간 관계에 대한 체계적인 구성적 추론을 위한 아키텍처 메커니즘이 필요함을 시사한다.