본 논문은 대규모 언어 모델을 사용한 비꼬기(Sarcasm) 분류 및 생성에 대한 연구를 다룬다. 기존 모델들이 비꼬기의 미묘한 특성 때문에 어려움을 겪는다는 점을 지적하며, MUStARD 데이터셋을 기반으로 7가지 유형(자기 비하, 우울, 무표정, 정중, 불쾌한, 격렬한, 광적인)의 비꼬기를 분류하는 Sarc7 벤치마크를 제시한다. 제로샷, 퓨샷, 사고연쇄(CoT), 그리고 새로운 감정 기반 프롬프팅 기법을 사용하여 분류 성능을 평가하고, 비꼬기의 핵심 요소(모순, 충격, 맥락 의존성)를 파악하여 감정 기반 생성 방법을 제안한다. 실험 결과, 감정 기반 프롬프팅을 사용한 Gemini 2.5 모델이 F1 score 0.3664로 다른 설정보다 우수한 성능을 보였으며, 인간 평가자들은 감정 기반 프롬프팅이 제로샷 프롬프팅보다 38.46% 더 성공적인 생성 결과를 보였다고 평가했다.