Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

TaoSR1: The Thinking Model for E-commerce Relevance Search

Created by
  • Haebom

作者

Chenhe Dong, Shaowei Yao, Pengkun Jiao, Jianhui Yang, Yiming Jin, Zerui Huang, Xiaojiang Zhou, Dan Ou, Haihong Tang, Bo Zheng

概要

本論文では、Eコマース検索におけるクエリ/製品関連性予測のための大規模言語モデル(LLM)直接配布フレームワークであるTaoSR1を提案します。このフレームワークは、Chain-of-Thought(CoT)エラーの蓄積、差別的な幻覚、展開可能性の問題を解決し、SFT、オフラインサンプリング、および動的サンプリングの3つのステップを経ます。 TaoSR1は、オフラインデータセットで従来のモデルより優れた性能を示し、オンラインで大幅な改善を示した。

Takeaways、Limitations

Takeaways:
CoT推論を関連性分類に適用する新しいパラダイムを提示した。
LLMを直接展開して、クエリ - 製品関連性予測の問題を解決しました。
オンライン/オフライン評価の両方で、既存のモデルと比較して有意なパフォーマンスが向上しました。
Limitations:
具体的なLimitationsは論文で明示的に言及されていない。
フレームワークの複雑さにより、実装とメンテナンスが困難になる可能性があります。
論文の結果を他のドメインまたはLLMモデルに一般化できるかどうかはさらに研究が必要です。
👍