본 논문은 텍스트 내 사회적 편향 감지를 위한 새로운 프레임워크인 GUS(Generalizations, Unfairness, Stereotypes) 프레임워크를 제안합니다. 기존의 이분법적 분류 방식의 한계를 극복하기 위해, 일반화, 불공정성, 고정관념이라는 세 가지 언어적 구성 요소에 초점을 맞춰 보다 세분화된 접근 방식을 제시합니다. 반자동화 방식으로 생성된 종합적인 합성 데이터셋을 사용하여 다중 레이블 토큰 분류를 수행하며, 판별적 모델(인코더 전용)과 생성적 모델(자기회귀형 대규모 언어 모델)을 결합한 방법론을 제시합니다. 실험 결과, 인코더 전용 모델이 다양한 맥락에서 명시적 및 암시적 편향을 효과적으로 감지하며 기존 최첨단 방법보다 성능이 우수함을 보여줍니다.