EVADE: Multimodal Benchmark for Evasive Content Detection in E-Commerce Applications
Created by
Haebom
저자
Ancheng Xu, Zhihao Yang, Jingpeng Li, Guanghu Yuan, Longze Chen, Liang Yan, Jiehui Zhou, Zhen Qin, Hengyun Chang, Hamid Alinejad-Rokny, Bo Zheng, Min Yang
개요
본 논문은 전자상거래 플랫폼에서 불법 또는 오도성 상품 콘텐츠 탐지를 위해 사용되는 대규모 언어 모델(LLM)과 비전-언어 모델(VLM)의 취약성을 다룹니다. 특히, 플랫폼 정책을 표면적으로 준수하면서 은밀하게 금지된 주장을 전달하는 회피 콘텐츠에 대한 모델의 취약성을 분석합니다. 기존의 적대적 공격과 달리 회피 콘텐츠는 모호성과 맥락을 이용하여 탐지를 어렵게 만듭니다. 따라서 본 논문에서는 전자상거래 환경에서 회피 콘텐츠 탐지 성능을 평가하기 위한 최초의 전문가 검수 중국어 다중 모달 벤치마크인 EVADE를 제시합니다. EVADE는 6가지 제품 카테고리(체형 변형, 키 성장, 건강 보조제 등)에 걸쳐 2,833개의 주석이 달린 텍스트 샘플과 13,961개의 이미지를 포함합니다. 두 가지 보완적인 과제(Single-Violation과 All-in-One)를 통해 모델의 미세 조정 추론 및 장문맥락 추론 능력을 평가하며, 26개의 주요 LLM 및 VLM을 벤치마킹하여 상당한 성능 차이를 관찰했습니다. EVADE 데이터셋과 강력한 기준 모델을 공개하여 회피 콘텐츠 탐지 평가에 대한 엄격한 표준을 제시하고, 현재 다중 모달 추론의 근본적인 한계를 드러내며, 전자상거래에서 더 안전하고 투명한 콘텐츠 조정 시스템을 위한 기반을 마련합니다. 데이터셋은 https://huggingface.co/datasets/koenshen/EVADE-Bench 에서 이용 가능합니다.