본 논문은 소셜 미디어의 급증으로 인한 온라인 콘텐츠의 독성 문제를 해결하기 위해, 대규모 언어 모델(LLM)을 활용한 독성 감지 시스템의 한계점(잘못된 음성 판정 및 과민 반응으로 인한 잘못된 양성 판정)을 극복하는 새로운 방법인 MetaTox를 제안합니다. MetaTox는 세 단계 파이프라인을 통해 독성 정보를 추출하고, 메타 독성 지식 그래프를 구축하여 그래프 검색을 통해 정확하고 관련성 있는 독성 정보를 보완함으로써, 잘못된 양성 판정률을 낮추고 독성 감지 성능을 향상시킵니다. 다양한 데이터셋에 대한 실험과 사례 연구를 통해 MetaTox의 효과를 입증하며, 코드는 공개적으로 제공합니다.