본 논문은 대규모 언어 모델을 사용한 비꼬기(sarcasm) 분류 및 생성에 초점을 맞추고 있다. 기존의 비꼬기 감지의 어려움을 해결하기 위해, MUStARD 데이터셋을 기반으로 자기비하, 침울, 무표정, 정중, 불쾌, 격분, 광적인 등 7가지 유형의 비꼬기를 분류하는 Sarc7 벤치마크를 제시한다. 제로샷, 퓨샷, 사고연쇄(CoT), 그리고 새로운 감정 기반 프롬프팅 기법을 사용하여 분류 성능을 평가하고, 비꼬기의 핵심 요소인 불일치, 충격 요소, 문맥 의존성을 파악하여 감정 기반 생성 방법을 제안한다. 실험 결과, Gemini 2.5 모델이 감정 기반 프롬프팅을 사용했을 때 0.3664의 F1 점수를 달성하여 다른 설정보다 우수한 성능을 보였으며, 사람 평가자들은 감정 기반 프롬프팅이 제로샷 프롬프팅보다 38.46% 더 성공적인 생성 결과를 보였다고 평가했다.