본 논문은 감정 인식 언어 처리 분야의 발전을 위해, 감정의 세분성과 스타일 다양성을 모두 고려한 새로운 데이터셋 ELSA (Emotion and Language Style Alignment Dataset)를 제시합니다. 기존 감정 데이터셋의 한계인 감정의 세분성 부족 및 스타일 다양성 결여 문제를 해결하기 위해, dair ai 감정 데이터셋과 GoEmotions 분류 체계를 활용하여 세분화된 감정 분류 체계를 도입하고, 대규모 언어 모델(LLM)을 이용하여 다양한 문맥 스타일(대화체, 형식체, 시적, 서술적)을 가진 여러 감정적 변형 문장을 생성했습니다. 혼란도, 임베딩 분산, 가독성, 어휘 다양성, 의미 일관성 등의 지표를 사용한 엄격한 계산적 평가를 통해 데이터셋의 감정적 진정성, 언어적 유창성, 그리고 문장 다양성을 검증하였으며, 세분화된 감정 제어, 프롬프트 기반 설명, 해석 가능성, 그리고 스타일 적응형 표현 언어 생성 등의 연구에 활용될 수 있음을 확인했습니다.