본 논문은 생성형 AI 대규모 언어 모델(LLM)이 생성한 콘텐츠로 인터넷이 포화되는 현상에 대한 정확한 측정의 어려움을 다룹니다. ChatGPT가 자주 사용하는 특정 키워드의 빈도를 분석하여 생성형 AI 콘텐츠의 존재를 효과적으로 추정할 수 있음을 보여줍니다. 분석 결과, 활성 웹 페이지 텍스트의 최소 30%가 AI 생성 콘텐츠이며, 실제 비율은 40%에 가까울 것으로 추정합니다. 이는 자기소멸적 순환(autophagous loops)의 시사점을 고려할 때 심각한 문제임을 시사합니다.