본 논문은 미국 대통령 선거 TV 광고에 대한 가장 크고 포괄적인 디지털 데이터셋을 소개한다. 해당 데이터셋은 기계 검색 가능한 자막과 고품질 요약본을 포함하여 다양한 학술 연구를 용이하게 한다. 기존의 수동 데이터 확보 및 주석 작업의 어려움을 극복하기 위해, 대규모 병렬 처리가 가능한 AI 기반 분석 파이프라인을 설계하여 비디오 준비, 자막 생성, 요약 과정을 자동화하였다. 이 파이프라인을 Julian P. Kanter Political Commercial Archive의 9,707개의 대통령 선거 광고에 적용하였으며, 인간 평가를 통해 자동 생성된 자막과 요약의 품질이 수동 생성본과 동등함을 확인하였다. 70년간의 대통령 선거를 통해 주요 이슈 영역의 발생과 변화를 추적하는 애플리케이션을 통해 데이터의 활용 가치를 보여주고 있으며, LLM 기반 도구를 활용하여 다른 비디오 데이터셋에 고품질 요약을 얻는 방법 또한 제시한다.