Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Improved Personalized Headline Generation via Denoising Fake Interests from Implicit Feedback

Created by
  • Haebom

저자

Kejin Liu, Junhong Lian, Xiang Ao, Ningtao Wang, Xing Fu, Yu Cheng, Weiqiang Wang, Xinyu Liu

개요

본 논문은 사용자의 과거 클릭 데이터를 기반으로 개인화된 헤드라인을 생성하는 기존 방법들이 클릭 스트림 내의 비관련 클릭 노이즈를 고려하지 않아 사용자의 실제 선호도와 일치하지 않는 헤드라인을 생성할 수 있다는 문제점을 지적합니다. 이를 해결하기 위해, PHG-DIF(Personalized Headline Generation framework via Denoising Fake Interests from Implicit Feedback)라는 새로운 프레임워크를 제안합니다. PHG-DIF는 짧은 체류 시간 및 비정상적인 클릭 폭발을 기준으로 이중 필터링을 통해 클릭 스트림 노이즈를 제거하고, 다단계 시간적 융합을 통해 사용자의 진화적이고 다면적인 관심사를 동적으로 모델링하여 정확한 사용자 프로파일링을 수행합니다. 또한, 1,000명의 사용자 클릭 데이터와 약 10,000개의 주석이 달린 개인화된 헤드라인으로 구성된 새로운 벤치마크 데이터셋 DT-PENS를 공개합니다. 실험 결과, PHG-DIF는 클릭 노이즈의 부정적 영향을 크게 완화하고 최첨단 성능을 달성합니다.

시사점, 한계점

시사점:
클릭 스트림 노이즈가 개인화된 헤드라인 생성에 미치는 부정적 영향을 규명하고, 이를 완화하는 효과적인 방법을 제시합니다.
사용자의 다면적이고 진화하는 관심사를 효과적으로 모델링하는 새로운 프레임워크 PHG-DIF를 제안합니다.
개인화된 헤드라인 생성 연구를 위한 새로운 벤치마크 데이터셋 DT-PENS를 공개합니다.
PHG-DIF는 기존 방법보다 개선된 성능을 보이며 최첨단 성능을 달성합니다.
한계점:
DT-PENS 데이터셋의 규모가 상대적으로 작을 수 있습니다. (1,000명의 사용자와 약 10,000개의 헤드라인)
클릭 노이즈 제거 기준(짧은 체류 시간, 비정상적인 클릭 폭발)의 일반성 및 적용 가능성에 대한 추가적인 연구가 필요할 수 있습니다.
다양한 유형의 클릭 노이즈에 대한 일반화 성능 검증이 추가적으로 필요할 수 있습니다.
👍