본 논문은 불법 약물 거래가 온라인 플랫폼을 통해 활발히 이루어지는 현실을 고려하여, 불균형적인 데이터 분포와 부족한 라벨링 데이터 문제를 해결하는 새로운 불법 약물 거래 탐지 프레임워크 LLM-HetGDT를 제안합니다. LLM-HetGDT는 대규모 언어 모델(LLM)을 활용하여 이종 그래프 신경망(HGNN)을 개선하고, 특히 소수 클래스의 데이터를 증강하여 불법 약물 거래 활동을 효과적으로 식별합니다. 먼저 비지도 학습을 통해 HGNN을 사전 훈련하고, LLM을 이용하여 소수 클래스의 합성 노드를 생성하여 그래프를 확장합니다. 마지막으로 확장된 그래프에서 소프트 프롬프트를 미세 조정하여 소수 클래스의 중요 정보를 학습하고 불법 약물 거래 탐지 성능을 향상시킵니다. Twitter 데이터를 기반으로 새롭게 구축한 이종 그래프 데이터셋 Twitter-HetDrug을 사용하여 광범위한 실험을 수행하여 LLM-HetGDT의 효과성, 효율성 및 적용 가능성을 검증합니다.