Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Abusive text transformation using LLMs

Created by
  • Haebom

저자

Rohitash Chandra, Jiyong Choi

개요

본 논문은 대규모 언어 모델(LLM)을 이용하여 악성 문장(혐오 발언 및 욕설 포함 트윗 및 리뷰)을 비악성 문장으로 변환하면서 문맥은 유지하는 연구를 다룬다. Gemini, GPT-4o, DeekSeek, Groq 네 가지 최첨단 LLM을 사용하여 악성 문장 식별 및 변환 성능을 평가하고, 감정 분석 및 의미 분석을 통해 원본 및 변환된 데이터셋을 비교 분석한다. 그 결과, Groq은 다른 LLM과 현저히 다른 결과를 보였으며, GPT-4o와 DeepSeek-V3는 유사한 성능을 보였다는 것을 확인했다.

시사점, 한계점

시사점: LLM을 이용한 악성 문장 변환의 가능성과 한계를 실험적으로 보여줌. 다양한 LLM의 성능 비교를 통해 최적 모델 선택에 대한 지침 제공. 감정 및 의미 분석을 통한 정량적 평가 제시.
한계점: 평가에 사용된 LLM의 종류가 제한적임. 더욱 다양하고 광범위한 악성 문장 유형에 대한 추가 연구 필요. 변환된 문장의 질적 평가 부족 (예: 자연스러움, 문맥 유지의 정확성 등). Groq의 특이한 결과에 대한 추가 분석 필요.
👍