Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

MuSeD: A Multimodal Spanish Dataset for Sexism Detection in Social Media Videos

Created by
  • Haebom

作者

Laura De Grazia, Pol Pastells, Mauro V azquez Chas, Desmond Elliott, Danae S anchez Villegas, Mireia Farr us, Mariona Taul e

概要

本論文は、オンライン賞、特にチックトークやビーチチュートなどのソーシャルメディアプラットフォームのビデオコンテンツでの性差別を検出するための多モーダルアプローチを提供します。スペイン語で構成された新しい多モーダル性差別センシングデータセットMuSeD($ \ approx $ 11時間分のビデオ)を紹介し、テキスト、音声、視覚モダリティの貢献度を分析する革新的な注釈フレームワークを提案します。さまざまな大規模言語モデル(LLM)と多モーダルLLMを性差別検知作業に評価し、視覚情報が性差別コンテンツラベリングに重要な役割を果たすことを発見しました。モデルは、明示的な性差別は効果的に検出されますが、ステレオタイプのように暗黙の場合には困難を経験することを示しています。これは、暗黙の性差別の識別が社会的、文化的文脈に依存するため、作業自体の困難を強調します。

Takeaways、Limitations

Takeaways:
ソーシャルメディアビデオコンテンツ内の性差別を検出するための新しい多モーダルデータセットMuSeDを提供。
テキスト、音声、ビジュアルモダリティを統合した革新的な性差別センシングアノテーションフレームワークの提示。
様々なLLMと多モーダルLLMの性差別センシング性能評価と視覚情報の重要性の確認
暗黙の性差別感知の難しさと社会文化的文脈の重要性を強調する。
Limitations:
データセットはスペイン語でのみ構成され、他の言語への一般化に制限があります。
モデルが暗黙的性差別(固定観念など)の検出に困難を示す。
アノテータ間の合意度が低い場合が存在するため、アノテーションの信頼性に関する懸念。
👍