Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

HiTeC: Hierarchical Contrastive Learning on Text-Attributed Hypergraph with Semantic-Aware Augmentation

Created by
  • Haebom

作者

Mengting Pan、Fan Li、Xiaoyang Wang、Wenjie Zhang、Xuemin Lin

概要

本稿では、テキスト属性を持つハイパーグラフ(TAHG)での自己地図学習のための新しいフレームワークであるHiTeCを提案します。従来の対照学習ベースの方法は、TAHGsのテキスト情報を効果的に活用できず、ランダムなデータ増強によるノイズ、長距離依存性捕捉の困難などの限界を持つことを指摘しています。 HiTeCは、構造認識対照目的関数を使用したテキストエンコーダの事前学習フェーズと、プロンプト強化テキストエンハンスメントとセマンティクス認識ハイパーエッジ削除などのセマンティクス認識エンハンスメント戦略を利用する2番目のステップで構成されています。さらに、s-walk ベースのサブグラフレベルのコントラストを通じて長距離依存性をよりよく捉えるマルチスケールコントラスト損失関数を提案する。これらの2段階設計により、テキストエンコーダの事前学習とハイパーグラフ対照学習を分離し、スケーラビリティを高め、表現品質を維持します。広範な実験によりHiTeCの効果を確認した。

Takeaways、Limitations

Takeaways:
テキスト属性を持つハイパーグラフでの自己地図学習のための効果的でスケーラブルな新しいフレームワークHiTeCの提示。
構造認識対照学習と意味認識増強戦略による既存の方法の限界の克服
マルチスケール対照損失関数による長距離依存性の効果的捕捉
2段階設計によるテキストエンコーダの事前学習とハイパーグラフ対照学習の分離によるスケーラビリティの向上
Limitations:
HiTeCの性能向上が特定のタイプのTAHGに限定される可能性。
提案された意味認識強化戦略の最適化パラメータ設定に関するさらなる研究が必要である。
マルチスケール対照損失関数の計算複雑度が高い可能性がある。
実際の大規模データセットの適用性と一般化パフォーマンスの追加検証が必要です。
👍