본 논문은 대규모 언어 모델(LLM)을 이용하여 악성 문장(혐오 발언 및 욕설 포함 트윗 및 리뷰)을 비악성 문장으로 변환하면서 문맥은 유지하는 연구를 다룬다. Gemini, GPT-4o, DeekSeek, Groq 네 가지 최첨단 LLM을 사용하여 악성 문장 식별 및 변환 성능을 평가하고, 감정 분석 및 의미 분석을 통해 원본 및 변환된 데이터셋을 비교 분석한다. 그 결과, Groq은 다른 LLM과 현저히 다른 결과를 보였으며, GPT-4o와 DeepSeek-V3는 유사한 성능을 보였다는 것을 확인했다.