본 논문은 강화 학습을 통해 미세 조정된 대규모 언어 모델(LLM)의 은닉 메시지 삽입(스테가노그래피) 능력을 탐구한다. 연구는 LLM이 (1) 은밀한 인코딩 기법을 개발하고, (2) 프롬프트를 받으면 스테가노그래피를 수행하며, (3) 은닉 추론이 있을 법하지만 프롬프트가 없는 현실적인 시나리오에서 스테가노그래피를 활용하는 능력에 초점을 맞춘다. 실험을 통해 LLM의 추론 은닉 의도와 스테가노그래피 성능을 탐지하고, 미세 조정 실험과 비 미세 조정 행동 평가 결과를 바탕으로 현재 모델은 보안 및 용량 측면에서 기본적인 스테가노그래피 능력을 보이지만, 명시적인 알고리즘 지침이 정보 은닉 능력을 현저히 향상시킨다는 것을 밝혔다.