본 연구는 텔레비전 방송 프로그램의 시청률 예측 정확도를 높이기 위해 기존 시청률 데이터에 자연어 처리(NLP) 기술을 접목한 머신러닝 프레임워크를 제시합니다. 25,000편 이상의 에피소드 대사를 분석하여 감정적 어조, 인지적 복잡성, 서사 구조 등의 NLP 특징을 추출하고, SARIMAX, Rolling XGBoost, 특징 선택 모델을 사용하여 예측 성능을 평가합니다. 기존 시청률 데이터가 강력한 예측 변수임을 확인했으며, 일부 시리즈에서는 NLP 특징이 예측 정확도를 향상시키는 것을 발견했습니다. 또한, 대사 벡터 간 유클리드 거리 기반의 유사도 측정 방법을 제시하여 콘텐츠 유사성을 비교 분석하고, Better Call Saul 및 Abbott Elementary 등 다양한 장르의 프로그램을 대상으로 장르별 성능 차이를 분석하여 작가, 임원, 마케팅 담당자에게 데이터 기반의 통찰력을 제공합니다.