차세대 무선 통신 시스템은 중요 응용 분야를 위해 초고신뢰 저지연 통신(URLLC) 서비스를 지원해야 한다. 엄격한 URLLC 요구 사항을 충족하는 것은 특히 2-홉 협력 통신에서 어렵다. 본 논문에서는 2-홉 중계 통신 시스템을 위한 적응적 전송 설계를 개발한다. 각 홉 전송은 엄격한 지연 제약 내에서 안정적인 패킷 전송을 위해, numerology, 미니 슬롯 크기, 변조 및 코딩 방식 등 전송 매개변수를 개별적으로 적응적으로 구성한다. 홉별 송수신기 구성을 Markov 결정 프로세스(MDP)로 공식화하고, 분산 방식으로 지연을 고려한 전송 정책을 학습하기 위해 이중 에이전트 강화 학습 기반 협력 지연 인식 전송(DRL-CoLA) 알고리즘을 제안한다. 시뮬레이션 결과는 제안된 알고리즘이 엄격한 지연 요구 사항을 충족하면서 거의 최적의 신뢰도를 달성함을 확인한다.