Pinterest와 같은 온라인 플랫폼은 방대한 콘텐츠 컬렉션을 관리하기 위해 기존에는 수동 큐레이션이나 사용자 생성 검색 로그를 사용하여 키워드 랜딩 페이지(KLP)를 생성했습니다. 수동 큐레이션은 품질을 보장하지만 수백만 개의 컬렉션으로 확장되지 않으며, 검색 로그 접근 방식은 제한된 주제 범위와 부정확한 콘텐츠 매칭으로 이어집니다. 본 논문에서는 주제별 컬렉션을 생성하는 방식을 변혁하는 새로운 콘텐츠 우선 아키텍처인 PinLanding을 제시합니다. 사용자 행동에서 주제를 파생하는 대신, 시각-언어 모델(VLM)을 사용한 속성 추출, 대규모 언어 모델(LLM)을 사용한 주제 생성, CLIP 기반 이중 인코더 아키텍처를 사용한 정밀한 콘텐츠 매칭을 결합한 다단계 파이프라인을 사용합니다. 제시된 모델은 Fashion200K 벤치마크에서 99.7% Recall@10을 달성하여 강력한 속성 이해 능력을 보여줍니다. 420만 개의 쇼핑 랜딩 페이지를 포함한 검색 엔진 최적화를 위한 프로덕션 배포에서, 본 시스템은 기존의 검색 로그 기반 접근 방식보다 주제 범위를 4배 증가시키고, 인간 평가를 통해 컬렉션 속성 정확도를 14.29% 향상시켰습니다. 이 아키텍처는 검색 트래픽을 넘어 콘텐츠 발견 및 추천을 포함한 다양한 사용자 경험을 강화하여 모든 콘텐츠 도메인에서 비정형 콘텐츠를 큐레이션된 주제별 컬렉션으로 변환하는 확장 가능한 솔루션을 제공할 수 있습니다.