본 논문에서는 활성 계층 대조 디코딩(ActLCD)이라는 새로운 디코딩 전략을 제안합니다. 기존의 토큰 단위 디코딩 방식과 달리, ActLCD는 강화 학습 기반 정책을 사용하여 생성 과정 중 대조 계층을 적용할 시점을 동적으로 결정합니다. 보상 인식 분류기를 통해 사실성을 최적화함으로써, 긴 맥락에서의 환각(hallucination) 문제를 해결하고자 합니다. 다섯 가지 벤치마크 실험 결과, ActLCD는 기존 최첨단 방법들을 능가하는 성능을 보였습니다.