본 논문은 대규모 언어 모델(LLM)이 특정 데이터 하위 집합(오류 슬라이스)에서 나타내는 체계적인 오류를 해결하기 위한 연구를 제시한다. 특히, 독성 댓글 분류 문제에서 인간이 정의한 슬라이스를 발견하는 Active Slice Discovery (ASD)라는 접근 방식을 제안하고, 이를 통해 소수의 주석만으로 오류 슬라이스를 효율적으로 식별하는 방법을 탐구한다. 다양한 특징 표현 및 능동 학습 알고리즘을 사용하여 ASD의 효과를 실험적으로 평가하며, 불확실성 기반 능동 학습 알고리즘이 경쟁력 있는 정확도를 달성하고 기준선을 능가함을 보여준다.