Subjective Behaviors and Preferences in LLM: Language of Browsing
Created by
Haebom
作者
Sai Sundaresan, Harshita Chopra, Atanu R. Sinha, Koustava Goswami, Nagasai Saketh Naidu, Raghav Karan, N Anushka
概要
本論文は、ユーザーのウェブサイトまたはアプリ利用行動という主観的で特異的なデータに基づいて、大規模言語モデル(LLM)の有用性に疑問を提起します。ユーザーのシーケンシャルページアクセス履歴を各ユーザーの固有の「ブラウジング言語」と見なして、小規模な言語モデルが大規模な言語モデルよりもこれらの「ブラウジング言語」をよりよく表現できるのか、単一パラメータを持つ言語モデルがさまざまなユーザーの異質な行動を十分に捉えることができるのか、高い平均性能を持つ単一言語モデルがユーザーレベルで一貫したパフォーマンスを示すのかについて。これに答えて、主観的な行動に適したクラスター固有の言語モデルの訓練方法であるHeTLM(Heterogeneity aware Training of Language Model)を提案し、小規模言語モデルがページ単位のトークナイザーを使用して訓練されたとき、大規模な事前訓練や微調整された言語モデルよりも性能が優れており、HeTLMが単一言語モデルよりも性能を向上し、改善が実験的に示されています。