본 논문은 인도 전역의 인쇄 신문 광고 관행에 대한 새로운 데이터 기반 접근 방식을 조사합니다. 이미지 처리 및 OCR 기술을 사용하는 파이프라인을 개발하여 인쇄 신문의 디지털 버전에서 기사와 광고를 높은 정확도로 추출합니다. 영어, 힌디어, 텔루구어 등 3개 언어를 사용하는 여러 지역에 걸쳐 5개의 인기 신문에 이 방법론을 적용하여 12,000개가 넘는 판본으로 구성된 수십만 개의 광고 데이터 세트를 만들었습니다. 이 신문들은 총 1억 명이 넘는 독자층에 도달합니다. 이 방대한 데이터 세트를 사용하여 인쇄 광고에 대한 핵심 질문(누가 광고하는가, 무엇을 광고하는가, 언제 광고하는가, 어디에 광고를 게재하는가, 어떻게 광고하는가)에 대한 포괄적인 분석을 수행합니다. 연구 결과는 인쇄 발행 부수 감소에도 불구하고 지난 6년 동안 인쇄 광고 수준이 일관되게 유지되었다는 점, 주요 페이지에 회사 광고가 과다하게 게재되었다는 점, 정부 광고가 수익에 불균형적으로 기여했다는 점을 포함한 중요한 패턴을 보여줍니다. 또한 신문 광고가 광고주가 받는 보도에 영향을 미치는지 여부를 조사합니다. 보도량과 감정 분석에 대한 회귀 분석을 통해 기업 광고주에 대해 이 가설을 뒷받침하는 강력한 증거를 발견했습니다. 결과는 광고 증가가 더 유리하고 광범위한 미디어 보도와 상관관계가 있다는 명확한 추세를 나타내며, 이러한 관계는 시간 경과에 따라 그리고 광고주의 인지도 수준에 관계없이 견고하게 유지됩니다.