対話で感情認識(ERC)という実用的でありながらも難しい課題について扱った論文で、新しいマルチモードアプローチである長短距離グラフニューラルネットワーク(LSDGNN)を提案する。方向性非循環グラフ(DAG)に基づいて長距離グラフニューラルネットワークと短距離グラフニューラルネットワークを構成し、それぞれ離れた発話と隣接する発話のマルチモード特性を得る。 2つのモジュール間の相互影響を可能にしながら、表現における長距離および短距離の特徴ができるだけ区別されるように差分正規化器を使用し、二重線形モジュールを組み込むことによって特徴の相互作用を容易にする。また、データの不均衡の問題を解決するために改善されたカリキュラム学習(ICL)を提案します。異なる感情間の類似性を計算し、同様の感情の変化を強調する「重み付け感情変化」指標を設計し、難易度メーターを開発し、簡単なサンプルを最初に学習する学習過程を可能にする。 IEMOCAPおよびMELDデータセットの実験結果は、提案されたモデルが既存のベンチマークを上回ることを示しています。