본 논문은 아이템의 수명주기를 새로운 제어 요소로 도입하여 공정성 인식 상호 추천 시스템(예: TikTok, KuaiShou)을 재조명합니다. 단편 영상 플랫폼에서 아이템 수명주기가 고전적인 4단계 모델과 달리, 급격한 성장, 일시적인 안정, 급격한 쇠퇴의 세 단계 패턴을 따른다는 것을 발견했습니다. 본 논문은 이를 기반으로, 단계별 노출 역학을 활용하여 공정성과 정확성을 동적으로 조화시키는 수명주기 인식 계층적 강화 학습 프레임워크인 LHRL을 제안합니다. LHRL은 견고한 단계 감지를 위한 STL 분해 및 어텐션 메커니즘을 결합한 경량 인코더인 PhaseFormer와, 단계 인식 공정성 제약을 부과하는 상위 수준 정책과 즉각적인 사용자 참여를 최적화하는 하위 수준 정책으로 구성된 2단계 HRL 에이전트로 구성됩니다.