본 논문은 대규모 언어 모델(LLM)이 특정 취약 계층, 특히 정신 건강 취약 계층에 대한 공격적인 발언을 생성하는 경향을 연구한 논문입니다. LLM이 생성한 공격적 발언에 대한 평가, 편향의 전파를 연구하기 위한 네트워크 기반 프레임워크, 그리고 이러한 공격으로 인한 낙인의 정도에 대한 평가라는 세 가지 주요 기여를 제시합니다. 최근 공개된 대규모 편향 감사 데이터셋 분석 결과, 정신 건강 관련 개체가 공격적 발언 네트워크에서 중심적인 위치를 차지하며, 높은 평균 근접 중심성과 밀집 클러스터링을 보이는 것으로 나타났습니다. 낙인 이론을 바탕으로 한 분석 결과, 정신 건강 장애 관련 표적에 대한 낙인 요소가 증가하는 것으로 나타났습니다. 결론적으로, 본 연구는 LLM이 유해한 담론을 증폭시키는 구조적 경향을 밝히고, 이를 완화하기 위한 적절한 접근 방식의 필요성을 강조합니다.