Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Multi-modal Relational Item Representation Learning for Inferring Substitutable and Complementary Items

Created by
  • Haebom

作者

Junting Wang, Chenghuan Guo, Jiao Yang, Yanhui Guo, Yan Gao, Hari Sundaram

概要

この論文は、代替および補完的なアイテムを推論するように設計された新しい自己地図学習ベースのマルチモードの関係アイテム表現学習フレームワークであるMMSCを提案します。従来のアプローチは、GNNを使用したユーザー行動から推論されたアイテム間の関連性のモデリングまたはアイテムコンテンツ情報の活用に焦点を当てていますが、ノイズの多いユーザー行動データと長い尾の分布によるデータ不足の問題を見落とす傾向があります。 MMSCは、マルチモード基本モデルを活用するマルチモードアイテム表現学習モジュール、ユーザー行動データからノイズを除去して学習する自己地図学習ベースのアクション表現学習モジュール、および意味レベルと作業レベルの両方でアイテム表現を統合する階層表現集計メカニズムで構成されています。さらに、LLMを活用して拡張学習データを生成し、学習中のノイズ除去プロセスをさらに向上させます。 5 つの実データセットの広範な実験により、MMSC は従来の基準モデルよりも代替推薦で 26.1%、補完推薦で 39.2% 向上したパフォーマンスを示し、コールドスタートアイテムのモデリングにも有効であることを実験的に実証します。

Takeaways、Limitations

Takeaways:
マルチモード情報と自己地図学習を組み合わせることで、ノイズの多いユーザー行動データとデータ不足の問題を効果的に解決します。
代替品や補完アイテムの推奨性能を大幅に向上させます。
コールドスタートアイテムの推奨性能を向上させます。
LLMを活用し、データ拡張によりモデルのパフォーマンスを向上させる新しい方法を紹介します。
Limitations:
LLMを活用したデータ拡張プロセスの信頼性と一般化性能のさらなる分析が必要です。
様々な種類のマルチモードデータの一般化性能評価が必要である。
実際のサービス環境でのリアルタイムの推奨性能と効率性の検証が必要です。
👍