Sign In

PinLanding: Content-First Keyword Landing Page Generation via Multi-Modal AI for Web-Scale Discovery

Created by
  • Haebom
Category
Empty

저자

Faye Zhang, Jasmine Wan, Qianyu Cheng, Jinfeng Rao

개요

Pinterest와 같은 온라인 플랫폼은 방대한 콘텐츠 컬렉션을 관리하기 위해 기존에는 수동 큐레이션이나 사용자 생성 검색 로그를 사용하여 키워드 랜딩 페이지(KLP)를 생성했습니다. 수동 큐레이션은 품질을 보장하지만 수백만 개의 컬렉션으로 확장되지 않으며, 검색 로그 접근 방식은 제한된 주제 범위와 부정확한 콘텐츠 매칭으로 이어집니다. 본 논문에서는 주제별 컬렉션을 생성하는 방식을 변혁하는 새로운 콘텐츠 우선 아키텍처인 PinLanding을 제시합니다. 사용자 행동에서 주제를 파생하는 대신, 시각-언어 모델(VLM)을 사용한 속성 추출, 대규모 언어 모델(LLM)을 사용한 주제 생성, CLIP 기반 이중 인코더 아키텍처를 사용한 정밀한 콘텐츠 매칭을 결합한 다단계 파이프라인을 사용합니다. 제시된 모델은 Fashion200K 벤치마크에서 99.7% Recall@10을 달성하여 강력한 속성 이해 능력을 보여줍니다. 420만 개의 쇼핑 랜딩 페이지를 포함한 검색 엔진 최적화를 위한 프로덕션 배포에서, 본 시스템은 기존의 검색 로그 기반 접근 방식보다 주제 범위를 4배 증가시키고, 인간 평가를 통해 컬렉션 속성 정확도를 14.29% 향상시켰습니다. 이 아키텍처는 검색 트래픽을 넘어 콘텐츠 발견 및 추천을 포함한 다양한 사용자 경험을 강화하여 모든 콘텐츠 도메인에서 비정형 콘텐츠를 큐레이션된 주제별 컬렉션으로 변환하는 확장 가능한 솔루션을 제공할 수 있습니다.

시사점, 한계점

시사점:
VLM, LLM, CLIP 기반 이중 인코더를 결합한 새로운 콘텐츠 우선 아키텍처(PinLanding)를 제시하여 대규모 콘텐츠 컬렉션의 주제별 분류 문제를 효과적으로 해결.
기존의 검색 로그 기반 접근 방식보다 주제 범위와 컬렉션 속성 정확도를 크게 향상시킴 (주제 범위 4배 증가, 정확도 14.29% 향상).
검색 엔진 최적화뿐 아니라 콘텐츠 발견 및 추천 등 다양한 사용자 경험에 적용 가능한 확장성 있는 솔루션 제공.
Fashion200K 벤치마크에서 99.7% Recall@10 달성으로 강력한 속성 이해 능력을 검증.
한계점:
논문에서 제시된 한계점에 대한 명시적인 언급이 없음. 추가적인 실험이나 다양한 데이터셋에 대한 성능 평가가 필요할 수 있음.
특정 도메인(쇼핑)에 대한 결과를 중심으로 제시되었으므로, 다른 도메인으로의 일반화 가능성에 대한 추가 연구가 필요할 수 있음.
시스템의 계산 비용 및 효율성에 대한 자세한 분석이 부족함.
👍