소셜 미디어에서 혐오 발언은 새로운 은어와 탐지 시스템을 회피하기 위한 용어의 지속적인 등장으로 인해 지속적인 문제로 남아 있습니다. 본 연구에서는 BERT를 혐오 발언 분류에 미세 조정하기 위한 데이터 효율적인 전략을 제시하며, 성능 저하 없이 훈련 세트 크기를 대폭 줄입니다. TF-IDF 기반 표본 선택 메커니즘을 사용하여 가장 유용한 예시의 75%만 유지함으로써 훈련 오버헤드를 최소화합니다. 또한, 진화하는 혐오 발언 용어를 포착하기 위해 BERT의 기본 어휘를 보완하기 위해 도메인 특정 은어와 학대적인 맥락에서 흔히 발견되는 어휘 변형을 추가했습니다. 널리 사용되는 혐오 발언 데이터 세트에 대한 실험 결과는 계산 효율성을 개선하면서 경쟁력 있는 성능을 달성하여 확장 가능하고 적응 가능한 유해 콘텐츠 관리에 대한 잠재력을 강조했습니다.