본 논문은 소셜 미디어의 급속한 성장으로 인해 발생하는 온라인 콘텐츠의 독성 문제를 해결하기 위해, 거대 언어 모델(LLM)을 활용한 독성 감지의 두 가지 주요 과제(도메인 특화 지식 부족으로 인한 위음성, 과민 반응으로 인한 위양성)를 해결하는 새로운 방법인 MetaTox를 제안한다. MetaTox는 세 단계 파이프라인을 통해 LLM을 활용하여 독성 정보를 추출하고, 이를 기반으로 구축된 메타 독성 지식 그래프 상에서 그래프 검색을 통해 정확하고 관련성 높은 독성 지식을 보충하여 독성 감지를 향상시킨다. 여러 데이터셋에 대한 실험 결과, MetaTox는 위양성률을 크게 감소시키면서 전반적인 독성 감지 성능을 향상시키는 것으로 나타났다.