Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

InterFormer: Effective Heterogeneous Interaction Learning for Click-Through Rate Prediction

Created by
  • Haebom

저자

Zhichen Zeng, Xiaolong Liu, Mengyue Hang, Xiaoyi Liu, Qinghai Zhou, Chaofei Yang, Yiqun Liu, Yichen Ruan, Laming Chen, Yuxin Chen, Yujia Hao, Jiaqi Xu, Jade Nie, Xi Liu, Buyun Zhang, Wei Wen, Siyang Yuan, Hang Yin, Xin Zhang, Kai Wang, Wen-Yen Chen, Yiping Han, Huayu Li, Chunzhi Yang, Bo Long, Philip S. Yu, Hanghang Tong, Jiyan Yang

개요

본 논문은 추천 시스템에서 사용자의 광고 클릭 확률을 예측하는 클릭률(CTR) 예측 문제를 다룬다. 사용자 프로필 및 행동 시퀀스와 같은 이종 정보의 등장으로 사용자의 관심사를 다양한 측면에서 파악할 수 있게 되었으며, 이러한 이종 정보의 상호 유익한 통합이 CTR 예측 성공의 핵심이다. 기존 방법들은 정보 흐름의 단방향성으로 인한 모드 간 상호 작용 부족과 조기 요약으로 인한 과도한 정보 손실이라는 두 가지 근본적인 한계를 갖는다. 본 논문에서는 이러한 한계를 해결하기 위해, 이종 정보 상호 작용을 교차 방식으로 학습하는 새로운 모듈인 InterFormer를 제안한다. InterFormer는 각 데이터 모드의 정보를 완전히 유지하고 효과적인 정보 선택 및 요약을 위한 별도의 연결 아키텍처를 사용하여, 상호 유익한 학습을 위한 양방향 정보 흐름을 가능하게 하고 과도한 정보 집계를 피한다. 제안된 InterFormer는 세 개의 공개 데이터셋과 대규모 산업용 데이터셋에서 최첨단 성능을 달성했다.

시사점, 한계점

시사점:
이종 정보의 상호 작용을 효과적으로 학습하는 새로운 모듈인 InterFormer를 제시하여 CTR 예측 성능 향상을 이끌었다.
양방향 정보 흐름과 정보 손실 최소화 전략을 통해 기존 방법들의 한계를 극복했다.
공개 데이터셋과 대규모 산업용 데이터셋에서 최첨단 성능을 검증하여 실제 적용 가능성을 보였다.
한계점:
InterFormer 모듈의 복잡성이 높아 계산 비용이 증가할 수 있다.
특정 데이터셋에 최적화된 하이퍼파라미터 설정이 필요할 수 있다.
제안된 방법의 일반화 성능에 대한 추가적인 연구가 필요하다.
👍