본 논문은 종단적 문제 설정에서 동적 치료 정책 하에 결과의 반실증적 평균을 추정하기 위한 새로운 방법인 심층 종단적 목표 최소 손실 기반 추정(Deep LTMLE)을 제안합니다. 본 방법은 시간 차이 학습을 사용하여 훈련된 이종 유형 임베딩을 포함하는 트랜스포머 아키텍처를 활용합니다. 트랜스포머를 사용하여 초기 추정치를 얻은 후, 목표 최소 손실 기반 우도 추정(TMLE) 프레임워크에 따라 기계 학습 알고리즘과 일반적으로 관련된 편향을 통계적으로 수정합니다. 또한, 점근적 통계 이론에 근거한 95% 신뢰 구간을 제공함으로써 통계적 추론을 용이하게 합니다. 시뮬레이션 결과는 특히 복잡하고 장기간의 시나리오에서 기존 방법보다 우수한 성능을 보여줍니다. 소표본, 단기간의 맥락에서도 효과적이며, 점근적으로 효율적인 추정량의 성능과 일치합니다. 실제 적용 사례로, 실제 세계 심혈관 역학 코호트 연구에서 표준 대비 집중적인 혈압 관리 전략에 대한 반실증적 평균 결과를 추정하는 데 본 방법을 적용했습니다.