본 연구는 현대 언어 모델을 사용하여 스크린플레이의 오스카상 후보 지명 예측 가능성을 탐구합니다. 이를 위해, 기존 데이터셋의 부재로 인해, MovieSum의 영화 스크립트 모음과 큐레이션된 오스카상 기록을 결합하여 Movie-O-Label이라는 새로운 데이터셋을 구축했습니다. 각 스크린플레이는 제목, 위키피디아 요약, 전체 스크립트로 표현되었습니다. 긴 스크립트는 중첩되는 텍스트 청크로 분할되었으며, E5 문장 임베딩 모델을 사용하여 인코딩되었습니다. 그 후, 로지스틱 회귀 모델을 사용하여 스크린플레이 임베딩을 분류했습니다. 스크린플레이와 관련된 세 가지 특징(스크립트, 요약, 제목)을 결합했을 때 가장 좋은 결과를 얻었으며, 최고의 성능을 보인 모델은 매크로 F1 점수 0.66, 정밀도-재현율 AP 0.445 (기준선 0.19), ROC-AUC 0.79를 기록했습니다.