Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Toward a benchmark for CTR prediction in online advertising: datasets, evaluation protocols and perspectives

Created by
  • Haebom
Category
Empty

저자

Shan Gao, Yanwu Yang

개요

본 연구는 CTR(Click-Through Rate) 예측 모델을 위한 유연한 인터페이스를 제공하는 통합 아키텍처의 벤치마크 플랫폼(Bench-CTR)을 설계합니다. 이 플랫폼은 실제 및 합성 데이터세트, 다양한 지표, 표준화된 절차, 실험 가이드라인을 포함하는 포괄적인 평가 프로토콜 시스템을 구축합니다. Bench-CTR을 구현하여 전통적인 다변량 통계 모델부터 최신 LLM(Large Language Model) 기반 접근 방식에 이르기까지 광범위한 최첨단 모델을 세 개의 공개 데이터세트와 두 개의 합성 데이터세트에서 비교 연구를 수행합니다.

시사점, 한계점

시사점:
고차 모델이 저차 모델보다 성능이 우수하나, 지표 및 데이터세트에 따라 차이가 있음.
LLM 기반 모델은 데이터 효율성이 뛰어나, 훈련 데이터의 2%만 사용하고도 다른 모델과 유사한 성능을 보임.
CTR 예측 모델의 성능은 2015-2016년에 큰 개선을 보인 후, 이후에는 발전 속도가 둔화됨.
CTR 예측 모델 개발 및 평가를 용이하게 하고, 모델의 기본 메커니즘에 대한 이해를 높임.
한계점:
논문 자체에서는 한계점에 대한 직접적인 언급이 없음. 벤치마크 플랫폼이 제공하는 데이터 세트의 다양성, 모델의 복잡성, 그리고 벤치마크가 포괄하는 모델의 종류 등이 한계점으로 작용할 수 있음.
👍