Sign In

LLM-Empowered Class Imbalanced Graph Prompt Learning for Online Drug Trafficking Detection

Created by
  • Haebom
Category
Empty

저자

Tianyi Ma, Yiyue Qian, Zehong Wang, Zheyuan Zhang, Chuxu Zhang, Yanfang Ye

개요

본 논문은 불법 약물 거래가 온라인 플랫폼을 통해 활발히 이루어지는 현실을 고려하여, 불균형적인 데이터 분포와 부족한 라벨링 데이터 문제를 해결하는 새로운 불법 약물 거래 탐지 프레임워크 LLM-HetGDT를 제안합니다. LLM-HetGDT는 대규모 언어 모델(LLM)을 활용하여 이종 그래프 신경망(HGNN)을 개선하고, 특히 소수 클래스의 데이터를 증강하여 불법 약물 거래 활동을 효과적으로 식별합니다. 먼저 비지도 학습을 통해 HGNN을 사전 훈련하고, LLM을 이용하여 소수 클래스의 합성 노드를 생성하여 그래프를 확장합니다. 마지막으로 확장된 그래프에서 소프트 프롬프트를 미세 조정하여 소수 클래스의 중요 정보를 학습하고 불법 약물 거래 탐지 성능을 향상시킵니다. Twitter 데이터를 기반으로 새롭게 구축한 이종 그래프 데이터셋 Twitter-HetDrug을 사용하여 광범위한 실험을 수행하여 LLM-HetGDT의 효과성, 효율성 및 적용 가능성을 검증합니다.

시사점, 한계점

시사점:
LLM을 활용하여 불균형 데이터 문제를 해결하는 새로운 접근 방식 제시.
이종 그래프 신경망을 활용하여 온라인 불법 약물 거래 탐지 성능 향상.
Twitter-HetDrug 데이터셋을 통해 실제 온라인 환경에서의 불법 약물 거래 분석 가능.
소수 클래스 데이터 증강을 통한 탐지 성능 개선 효과 확인.
한계점:
Twitter 데이터에만 국한된 데이터셋의 일반화 가능성 제한.
LLM의 성능에 의존적인 모델의 취약성.
합성 데이터의 품질에 따라 성능 저하 가능성.
다른 유형의 온라인 불법 활동에는 적용 가능성이 불확실.
👍