본 연구는 LLM(대규모 언어 모델)의 생성 능력을 특정 도메인에 맞게 조정하는 페르소나 프롬프팅의 효과를 탐구합니다. 특히, 전문가 페르소나가 LLM의 정렬(alignment)에는 도움이 되지만 정확도를 저해할 수 있다는 점을 발견했으며, 이를 해결하기 위해 PRISM(Persona Routing via Intent-based Self-Modeling)이라는 새로운 파이프라인을 제안합니다. PRISM은 외부 데이터 없이도 의도 기반의 전문가 페르소나를 자체적으로 증류하여 생성 작업에서는 인간 선호도와 안전 정렬을 향상시키면서도 판별 작업에서는 정확도를 유지합니다.