Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Cross-Platform E-Commerce Product Categorization and Recategorization: A Multimodal Hierarchical Classification Approach

Created by
  • Haebom

作者

Lotte Gross, Rebecca Walter, Nicole Zoppi, Adrien Justus, Alessandro Gambetti, Qiwei Han, Maximilian Kaiser

概要

本研究では、Eコマース製品分類の産業上の課題であるプラットフォームの不均一性と既存の分類システムの構造上の制限を解決するために、マルチモーダル階層分類フレームワークを開発および展開します。 40の国際ファッションeコマースプラットフォームで収集された271,700の製品データセットを使用して、テキスト機能(RoBERTa)、視覚的特徴(ViT)、および共同視覚言語表現(CLIP)を統合します。階層構造内で初期,後期,アテンションベースの融合戦略を研究し,分類システムの一貫性を確保するために動的マスキングを強化した。その結果、MLPベースの後期融合戦略を使用したCLIP埋め込みが最も高い階層F1スコア(98.59%)を達成し、単一のモーダル基準モデルを上回りました。浅いまたは不一致のカテゴリを解決するために、SimCLR、UMAP、およびカスケードクラスタリングを使用した自己地図学習ベースの「製品の再分類」パイプラインを導入し(「靴」のサブタイプなど)、86%以上のクラスタ純度を持つ新しい細分化されたカテゴリを発見しました。クロスプラットフォーム実験は、展開に関連するトレードオフを示しています。複雑な後期融合法は、様々な訓練データを使用して精度を最大化するが、単純な初期融合方法は、目に見えないプラットフォームでより効果的に一般化される。最後に、軽量RoBERTa段階とGPU加速マルチモーダル段階を組み合わせた2段階推論パイプラインを介して、EURWEBの商業取引情報プラットフォームにフレームワークを配布することで産業スケーラビリティを実証します。

Takeaways、Limitations

Takeaways:
マルチモーダル(テキスト、画像)情報融合によるEコマース製品分類精度の向上(98.59%F1スコア達成)。
自己地図学習ベースの製品再分類パイプラインによる既存の分類システムの限界を克服し、細分化されたカテゴリを発見する。
プラットフォーム間の一般化性能と精度の間のトレードオフを提示することで、実際の展開環境に適したモデル選択戦略を提示します。
産業的スケーラビリティを備えた実際のシステム構築と展開の成功事例を提示する。
Limitations:
特定のドメイン(ファッション)に限定された研究結果。他のドメインへの一般化の可能性に関するさらなる研究が必要
大規模なデータセットに依存するパフォーマンス。データ不足環境での性能低下の可能性
後期融合法の複雑性による計算コストの増加軽量化と最適化に関するさらなる研究が必要
磁気マップ学習ベースの再分類パイプラインのクラスタリング性能のさらなる分析が必要
👍