Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

EVADE: Multimodal Benchmark for Evasive Content Detection in E-Commerce Applications

Created by
  • Haebom

저자

Ancheng Xu, Zhihao Yang, Jingpeng Li, Guanghu Yuan, Longze Chen, Liang Yan, Jiehui Zhou, Zhen Qin, Hengyun Chang, Hamid Alinejad-Rokny, Bo Zheng, Min Yang

개요

본 논문은 전자상거래 플랫폼에서 불법 또는 오도성 상품 콘텐츠 탐지를 위해 사용되는 대규모 언어 모델(LLM)과 비전-언어 모델(VLM)의 취약성을 다룹니다. 특히, 플랫폼 정책을 표면적으로 준수하면서 은밀하게 금지된 주장을 전달하는 회피 콘텐츠에 대한 모델의 취약성을 분석합니다. 기존의 적대적 공격과 달리 회피 콘텐츠는 모호성과 맥락을 이용하여 탐지를 어렵게 만듭니다. 따라서 본 논문에서는 전자상거래 환경에서 회피 콘텐츠 탐지 성능을 평가하기 위한 최초의 전문가 검수 중국어 다중 모달 벤치마크인 EVADE를 제시합니다. EVADE는 6가지 제품 카테고리(체형 변형, 키 성장, 건강 보조제 등)에 걸쳐 2,833개의 주석이 달린 텍스트 샘플과 13,961개의 이미지를 포함합니다. 두 가지 보완적인 과제(Single-Violation과 All-in-One)를 통해 모델의 미세 조정 추론 및 장문맥락 추론 능력을 평가하며, 26개의 주요 LLM 및 VLM을 벤치마킹하여 상당한 성능 차이를 관찰했습니다. EVADE 데이터셋과 강력한 기준 모델을 공개하여 회피 콘텐츠 탐지 평가에 대한 엄격한 표준을 제시하고, 현재 다중 모달 추론의 근본적인 한계를 드러내며, 전자상거래에서 더 안전하고 투명한 콘텐츠 조정 시스템을 위한 기반을 마련합니다. 데이터셋은 https://huggingface.co/datasets/koenshen/EVADE-Bench 에서 이용 가능합니다.

시사점, 한계점

시사점:
전자상거래 플랫폼에서 회피 콘텐츠 탐지에 대한 최초의 전문가 검수 중국어 다중 모달 벤치마크(EVADE) 제시
LLM 및 VLM의 회피 콘텐츠 탐지 성능에 대한 엄격한 평가 기준 제공
현재 다중 모달 추론 모델의 근본적인 한계를 밝힘
더 안전하고 투명한 전자상거래 콘텐츠 조정 시스템 개발을 위한 기반 마련
명확한 규칙 정의가 인간과 모델 판단 간의 일치도를 향상시킨다는 것을 보여줌 (All-in-One 설정)
한계점:
벤치마크가 중국어 기반이며, 다른 언어로의 일반화 가능성은 추가 연구가 필요함.
특정 전자상거래 플랫폼에 국한된 데이터셋이므로, 다른 플랫폼으로의 일반화 가능성에 대한 추가 연구가 필요함.
회피 콘텐츠의 다양성을 완전히 포괄하지 못할 수 있음. 향후 더욱 다양한 유형의 회피 콘텐츠를 포함하도록 데이터셋을 확장할 필요가 있음.
현재 모델의 성능 한계를 명확히 밝혔지만, 이러한 한계를 극복하기 위한 구체적인 해결책은 제시하지 않음.
👍