본 논문은 대규모 언어 모델(LLM)의 성별 편향성을 평가하기 위한 새로운 프레임워크를 제시합니다. 기존의 구조화된 시나리오나 신중하게 구성된 프롬프트에 의존하는 방법과 달리, 자유 형식의 스토리텔링을 활용하여 모델에 내재된 편향을 밝혀냅니다. 6개의 널리 사용되는 LLM을 대상으로 한 체계적인 분석 결과, 여성 캐릭터가 여러 직업에서 과대표되는 것으로 나타났습니다. 또한, LLM이 생성한 직업 성별 순위는 실제 노동 통계보다 인간의 고정관념에 더 부합하는 것으로 나타났습니다. 이러한 결과는 새로운 고정관념을 강화하지 않으면서 공정성을 보장하기 위한 균형 잡힌 완화 전략의 필요성을 강조합니다.