재구성 가능한 지능형 표면(RIS)은 전자기파 특성을 동적으로 변경하여 빔 형성을 개선하고, 저 커버리지 영역을 향상시킬 수 있는 물리적 요소로 구성된다. 강화 학습(RL) 기술과 결합하여 시스템 동작과 물리 계층 보안 강화 모두를 향상시킬 수 있는 잠재력을 가진다. 본 논문에서는 효율적이고 공정한 듀플렉스 RIS-RL 시스템을 제안하며, 다수의 합법적인 사용자 장치(UE)에 충분한 신호 강도를 보장하면서 물리 계층 보안 강화 수준을 유지하는 것을 목표로 한다. 이전 연구의 공정성 문제를 해결하기 위해, 새로운 보상 전략을 제시하고, 실험 결과를 시뮬레이션을 통해 검증하며, 코드 및 데이터 세트를 공개하여 추가 연구를 장려한다.