Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Fairness of Automatic Speech Recognition: Looking Through a Philosophical Lens

Created by
  • Haebom

作者

Anna Seo Gyoong Choi, Hoon Choi

概要

本論文は、自動音声認識(ASR)システムの公平性の問題を哲学的観点から分析します。特定の言語変異体の体系的な誤認識は、単純な技術的限界を超えて疎外された言語コミュニティに対する歴史的不正を深める一種の失礼を示すと主張する。道徳的に中立的な分類(discriminate1)と有害な差別(discriminate2)を区別することで、ASRシステムが非標準的な方言を継続的に誤認識したときに前者が後者に切り替わることがあることを示しています。また、既存の技術的公平性測定指標が捉えられない非標準変異体話者に課される時間的負担(「時間的課税」)、システムの誤認識による対話フローの妨げ、および音声パターンと個人/文化的アイデンティティとの根本的な関連性など、ASR偏向の3つの固有の倫理的次元を提示。 ASR開発における言語標準化と多元主義の間の緊張関係を分析し、現在のアプローチがしばしば問題となる言語イデオロギーを内包し強化することを主張する。結論として、ASR偏向問題解決には技術的介入以上のものが必要であり、様々な言語変異体を技術的受容に適した正当な表現方式で認識しなければならないと強調する。この哲学的再構成は、言語の多様性と話者の自律性を尊重するASRシステムを開発するための新しい道を提示します。

Takeaways、Limitations

Takeaways:
ASRシステムの偏りは、単なる技術的問題ではなく、倫理的、社会的問題であることを強調しています。
既存の技術的測定指標としては、捕捉できないASR偏向の固有の倫理的次元(時間的課税、対話フロー妨害、アイデンティティとの関連性)を提示。
言語多様性を尊重するASRシステム開発のための新しい哲学的枠組みを提供します。
技術的介入だけでなく、社会的、文化的考慮が必要であることを強調。
Limitations:
提示された倫理的次元の具体的な測定方法または解決策の提示の欠如。
特定の言語変異体の具体的な分析事例の欠如
提示された哲学的枠組みの実際の適用性に関するさらなる研究の必要性
👍