온라인 상의 건강 정보 오류 확산은 공중 보건에 심각한 위협이 된다. 본 논문은 이를 완화하기 위한 전략으로 건강 정보 오류에 대한 반박 메시지를 자동 생성하는 방법을 연구한다. 기존 접근 방식은 청중의 건강 정보 이해 수준을 고려하지 않고 획일적인 반응을 생성하는 한계가 있다. 본 연구는 강화 학습(RL)을 사용한 검색 증강 생성(RAG)을 활용하여, 청중의 건강 정보 이해 수준에 맞춘 맞춤형 반박 메시지를 생성하는 제어된-건강정보이해(Controlled-Literacy) 프레임워크를 제안한다. 특히, 특정 건강 정보 이해 수준에 맞는 지식을 검색하여 생성에 필요한 접근 가능하고 사실적인 정보를 제공한다. 주관적인 사용자 선호도와 객관적인 가독성 기반 보상을 통합한 보상 함수를 설계하여 목표 건강 정보 이해 수준에 맞는 반박 메시지를 최적화한다. 실험 결과, 제어된-건강정보이해는 기존 방법보다 더 접근 가능하고 사용자 선호도가 높은 반박 메시지를 생성하는 것으로 나타났다. 본 연구는 건강 정보 오류에 대한 반박 메시지의 접근성과 이해도를 향상시킴으로써 보다 공평하고 효과적인 공중 보건 커뮤니케이션에 기여한다.