본 논문은 의료 및 행동 지원 분야에서 사용되는 개인화된 의사 결정 시스템이 사용자의 감정적 맥락과 윤리적 제약을 간과하는 문제점을 지적하고, 이를 해결하기 위해 감정적 이해와 윤리적 고려 사항을 순차적 의사 결정 과정에 통합하는 책임 강화 학습(RRL) 프레임워크를 제안한다. RRL은 개인화를 제약 마르코프 의사 결정 프로세스(CMDP)로 공식화하여, 에이전트가 감정적 정렬과 윤리적 안전을 보장하면서 참여와 준수를 최적화하도록 설계되었다. 단기적 행동 참여와 장기적 사용자 웰빙을 균형 있게 고려하는 다중 목표 보상 함수와, 감정적 준비도, 정서 및 위험의 변동을 포착하는 감정 기반 상태 표현을 도입한다.