본 논문은 페르소나 프로필과 대화 이력을 활용하여 페르소나와 관련된 일관된 응답을 생성하는 개인화된 대화 생성에 대해 다룹니다. 기존 모델들이 토큰 레벨 언어 모델 훈련에 의존하여 페르소나를 간과하고 일반적인 응답을 생성하는 문제를 해결하기 위해, 페르소나 정렬을 직접 훈련 목표로 하는 새로운 Persona-Aware Alignment Framework (PAL)을 제안합니다. PAL은 Persona-aware Learning과 Persona Alignment를 포함하는 2단계 훈련 방법과 Select then Generate 추론 전략을 통해 페르소나 민감도를 향상시키고, 의미론적 수준에서 페르소나 관련 응답을 생성합니다. 실험을 통해 제안된 프레임워크가 많은 최첨단 개인화된 대화 방법 및 대규모 언어 모델보다 우수함을 입증했습니다.