자기 소모적 생성 모델은 자체 출력에 대해 학습하며, 사용자 선호도와의 정렬이 일회성이 아닌 반복적인 과정으로 진행됩니다. 본 논문은 이러한 반복적 재학습이 정렬에 미치는 장기적 영향을 분석하기 위한 최초의 형식적 기반을 제공합니다. Bradley-Terry (BT) 모델을 기반으로 하는 2단계 큐레이션 메커니즘 하에서 모델의 정렬을 두 세력, 즉 모델 출력을 필터링하는 모델 소유자와 모델과의 상호 작용을 통해 궁극적으로 공유되고 유지되는 출력을 결정하는 공공 사용자의 상호 작용으로 모델링합니다. 분석 결과, 선호도 정렬 정도에 따라 세 가지 구조적 수렴 체제, 즉 합의 붕괴, 공유 최적값 타협, 비대칭적 개선이 나타났습니다. 또한, 다양성을 유지하고, 대칭적인 영향을 보장하며, 초기화 의존성을 제거하는 것을 동시에 달성할 수 없는 근본적인 불가능성 정리를 증명합니다. 이 과정을 동적 사회 선택으로 프레이밍하여, 정렬이 정적인 목표가 아닌, 권력 불균형과 경로 의존성에 의해 형성되는 진화하는 평형 상태임을 보여줍니다.