본 논문은 온라인 성착취 위험을 조기에 감지하고 개입하는 새로운 방법인 속도 제어 강화 학습(SCoRL)을 제안합니다. 기존 방법들이 대화 전체의 위험 수준에 기반하여 최적의 개입 시점을 파악하는 데 어려움을 겪는다는 점을 지적하며, 유인 의사소통 이론(LCT)에 기반한 턴 단위 위험 레이블을 활용하여 보다 정확하고 시기 적절한 개입을 가능하게 합니다. SCoRL은 속도와 정확성 간의 균형을 맞추는 새로운 속도 제어 보상 함수를 설계하여 최적의 개입 시점을 식별하며, 턴 단위 평가 지표를 도입하여 기존 방법의 한계를 극복합니다. 실험 결과, SCoRL이 온라인 성착취를 효과적으로 예방하고 최적의 조기 개입 시점을 직관적으로 식별함을 보여줍니다. 코드와 보충 자료는 GitHub에서 공개됩니다.