本論文は意図分類モデルの発展を扱うが,低資源はもちろん,文解率が低い地域の言語に対する研究不足問題を指摘する。特にセネガルの事例を挙げて、90%が使用するが、文盲率の高いWolof言語に注目する。 Wolof Banking Speech Intent Classification Dataset(WolBanking77)を紹介し、このデータセットには銀行関連ドメインの9,791個のテキスト文と4時間以上の音声文が含まれています。テキストと音声最新モデルを含むさまざまなベースモデルで実験を行い、肯定的な結果を得て、データセットの内容の詳細な分析を提供します。