Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

A Lightweight Approach to Detection of AI-Generated Texts Using Stylometric Features

Created by
  • Haebom
Category
Empty

저자

Sergey K. Aityan, William Claster, Karthik Sai Emani, Sohni Rais, Thy Tran

개요

AI 생성 텍스트 탐지에 대한 증가하는 관심 속에서, 기존의 방식들이 갖는 높은 계산 비용과 제한적인 일반화 문제를 해결하고자 합니다. 본 논문에서는 계산 효율성이 높고 높은 탐지 정확도를 제공하는 경량 접근 방식인 NEULIF를 제안합니다. NEULIF는 텍스트를 스타일 측정 및 가독성 특징으로 분해한 후, 소형 Convolutional Neural Network (CNN) 또는 Random Forest (RF)를 사용하여 분류합니다. Kaggle AI vs. Human corpus에서 CNN 모델은 97% 정확도 (0.95 F1), RF 모델은 95% 정확도 (0.94 F1)를 달성하여 높은 정밀도와 재현율을 보였습니다. CNN (25MB) 및 Random Forest (10.6MB) 모델은 기존의 Transformer 기반 모델보다 훨씬 작으며, 표준 CPU 장치에서 효율적으로 실행될 수 있습니다.

시사점, 한계점

시사점:
경량 모델(CNN, RF)을 활용하여 AI 생성 텍스트를 효과적으로 탐지할 수 있음을 입증했습니다.
높은 정확도와 효율성을 동시에 달성하여, 컴퓨팅 자원이 제한적인 환경에서도 활용 가능성을 제시했습니다.
단순한 구조를 사용하여 AI 생성 콘텐츠 탐지에서 복잡한 모델과 경쟁할 수 있음을 보여주었습니다.
다양한 언어, 도메인, 스트리밍 환경으로의 확장 가능성을 제시했습니다.
한계점:
논문에 구체적인 한계점 언급은 없습니다.
👍