[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

S2WTM: Spherical Sliced-Wasserstein Autoencoder for Topic Modeling

Created by
  • Haebom

作者

Suman Adhya、Debarshi Kumar Sanyal

概要

本論文は,高次元テキストデータの方向的類似性を捕捉するのに有効な超球面空間における潜在的表現モデリングに焦点を当てている。従来の変分オートエンコーダベースのニューラルネットワークトピックモデル(VAE-NTM)は、超球面構造をエンコードするためにvon Mises-Fisher辞書分布を使用しますが、 posterior collapse の問題により効果的な潜在表現が得られないことがよくあります。この問題を解決するために、本論文では、超球面スライスWasserstein距離を活用して集計された事後分布と事前分布を整列させるSherical Sliced Wasserstein Autoencoder for Topic Modeling(S2WTM)を提案します。実験の結果、S2WTMは既存の最先端のトピックモデルを上回り、より一貫性のあるさまざまなトピックを作成し、サブタスクのパフォーマンスを向上させることがわかりました。

Takeaways、Limitations

Takeaways:
超球面空間における潜在的表現モデリングにより高次元テキストデータの方向的類似性を効果的に捕捉できることを示した。
従来のVAE-NTMの posterior collapse問題をSherical Sliced Wasserstein距離を利用して効果的に解決
S2WTMは、既存の最先端のトピックモデルよりも一貫性があり、さまざまなトピックを作成し、サブタスクのパフォーマンスを向上させます。
Limitations:
論文で提示された実験結果の一般化の可能性についてのさらなる検証が必要である。
S2WTMの計算の複雑さと拡張性の分析が不足
特定のデータセットのパフォーマンス向上が他のデータセットにも同じように適用できるかどうかに関するさらなる研究が必要です。
👍