Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Multi-Agent VLMs Guided Self-Training with PNU Loss for Low-Resource Offensive Content Detection

Created by
  • Haebom
Category
Empty

저자

Han Wang, Deyi Ji, Junyu Lu, Lanyun Zhu, Hailong Zhang, Haiyang Wu, Liqun Liu, Peng Shu, Roy Ka-Wei Lee

개요

소셜 미디어의 공격적인 콘텐츠를 정확하게 탐지하기 위해서는 고품질의 레이블이 지정된 데이터가 필요하지만, 공격적인 인스턴스의 낮은 발생률과 수동 주석의 높은 비용으로 인해 이러한 데이터는 종종 부족합니다. 이러한 낮은 자원 문제를 해결하기 위해, 우리는 협업 의사 레이블링을 통해 풍부한 레이블이 지정되지 않은 데이터를 활용하는 자체 훈련 프레임워크를 제안합니다. 제한된 레이블이 지정된 데이터로 훈련된 경량 분류기로 시작하여, 우리의 방법은 Multi-Agent Vision-Language Models (MA-VLMs)의 지원을 받아 레이블이 지정되지 않은 인스턴스에 반복적으로 의사 레이블을 할당합니다. 분류자와 MA-VLM이 동의하는 레이블이 지정되지 않은 데이터는 Agreed-Unknown set으로 지정되고, 충돌하는 샘플은 Disagreed-Unknown set을 형성합니다. 레이블 신뢰도를 향상시키기 위해, MA-VLMs는 규제적 및 주관적 관점을 모두 포착하여, 관리자와 사용자의 이중 관점을 시뮬레이션합니다. 분류기는 레이블이 지정된 데이터, Agreed-Unknown 데이터 및 Disagreed-Unknown 데이터를 공동으로 활용하는 동시에 의사 레이블 노이즈를 완화하는 새로운 Positive-Negative-Unlabeled (PNU) loss를 사용하여 최적화됩니다. 벤치마크 데이터 세트에 대한 실험 결과는 우리의 프레임워크가 제한된 감독 하에서 기본 모델보다 훨씬 뛰어난 성능을 보이며 대규모 모델의 성능에 근접함을 보여줍니다.

시사점, 한계점

시사점:
제한된 레이블이 지정된 환경에서 공격적인 콘텐츠 탐지 성능 향상.
Multi-Agent Vision-Language Models (MA-VLMs)을 활용하여 레이블 신뢰도 향상.
Positive-Negative-Unlabeled (PNU) loss를 사용하여 의사 레이블 노이즈 완화.
대규모 모델에 근접하는 성능 달성.
한계점:
MA-VLMs의 성능에 의존적.
Disagreed-Unknown set에 대한 추가적인 처리 필요성.
다른 도메인으로의 일반화 가능성 추가 연구 필요.
👍