소셜 미디어의 공격적인 콘텐츠를 정확하게 탐지하기 위해서는 고품질의 레이블이 지정된 데이터가 필요하지만, 공격적인 인스턴스의 낮은 발생률과 수동 주석의 높은 비용으로 인해 이러한 데이터는 종종 부족합니다. 이러한 낮은 자원 문제를 해결하기 위해, 우리는 협업 의사 레이블링을 통해 풍부한 레이블이 지정되지 않은 데이터를 활용하는 자체 훈련 프레임워크를 제안합니다. 제한된 레이블이 지정된 데이터로 훈련된 경량 분류기로 시작하여, 우리의 방법은 Multi-Agent Vision-Language Models (MA-VLMs)의 지원을 받아 레이블이 지정되지 않은 인스턴스에 반복적으로 의사 레이블을 할당합니다. 분류자와 MA-VLM이 동의하는 레이블이 지정되지 않은 데이터는 Agreed-Unknown set으로 지정되고, 충돌하는 샘플은 Disagreed-Unknown set을 형성합니다. 레이블 신뢰도를 향상시키기 위해, MA-VLMs는 규제적 및 주관적 관점을 모두 포착하여, 관리자와 사용자의 이중 관점을 시뮬레이션합니다. 분류기는 레이블이 지정된 데이터, Agreed-Unknown 데이터 및 Disagreed-Unknown 데이터를 공동으로 활용하는 동시에 의사 레이블 노이즈를 완화하는 새로운 Positive-Negative-Unlabeled (PNU) loss를 사용하여 최적화됩니다. 벤치마크 데이터 세트에 대한 실험 결과는 우리의 프레임워크가 제한된 감독 하에서 기본 모델보다 훨씬 뛰어난 성능을 보이며 대규모 모델의 성능에 근접함을 보여줍니다.