Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Persistent Homology of Topic Networks for the Prediction of Reader Curiosity

Created by
  • Haebom

作者

Manuel DS Hopp (LIA), Vincent Labatut (LIA), Arthur Amalvy (LIA), Richard Dufour (LS2N - equipe TALN), Hannah Stone, Hayley Jach, Kou Murayama

概要

本論文は、読者の情報探求の欲求である読書好奇心を自然言語処理(NLP)の観点からモデル化する新しいフレームワークを提示します。ローウェンシュタインの情報ギャップ理論に基づいて,テキストの意味構造内の意味論的情報ギャップを定量化して,読書好奇心を測定する。 BERTopicベースのトピックモデリングと持続的なホモロジーを活用して、テキストセグメントに由来する動的セマンティックネットワークの位相構造(接続要素、循環、空隙)を分析し、これらの特徴を情報ギャップの代理指標として活用します。実験的には、参加者49人を対象にS. Collinsの「ハンガーゲーム」小説に対する読書好奇心評価を収集し、開発したパイプラインの位相的特徴を独立変数として使用してこれらの評価を予測するモデルを構築しました。その結果、参照モデル(説明された分散の30%)と比較して、読者の好奇心予測性能が有意に改善された(説明された分散の73%)ことが示され、提示された方法の有効性が検証された。本研究では、テキスト構造と読者参加の関係を分析する新しい計算方法を提供します。

Takeaways、Limitations

Takeaways:
テキストの意味論的情報のギャップを定量化して読書の好奇心を測定する新しいフレームワークの提示
BERTopicと継続的なホモロジーを活用した革新的なアプローチの提示
テキスト構造解析と読者参加研究に新しい計算方法を提供
既存モデルと比較した読書好奇心予測性能の向上(説明分散73%対30%)
Limitations:
「ハンガーゲーム」単一小説データを用いた実験で一般化の可能性に関するさらなる研究が必要
参加者数(N = 49)が比較的少なく、結果の一般化の可能性に対する制限の存在
さまざまなジャンルやテキストタイプの追加実験が必要
情報ギャップ理論に依存して、他の読書参加要因を考慮する必要性の存在
👍