Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

L'équité de la reconnaissance automatique de la parole : un regard philosophique

Created by
  • Haebom

Auteur

Anna Seo Gyeong Choi, Hoon Choi

Contour

Cet article analyse la question de l'équité dans les systèmes de reconnaissance automatique de la parole (RAP) d'un point de vue philosophique. Il soutient que la méconnaissance systématique de certaines variantes linguistiques dépasse les simples limitations techniques et constitue une forme d'irrespect qui exacerbe les injustices historiques envers les communautés linguistiques marginalisées. En distinguant les classifications moralement neutres (discrimination1) et la discrimination préjudiciable (discrimination2), il démontre que la méconnaissance persistante des dialectes non standard peut s'aggraver. De plus, il identifie trois dimensions éthiques distinctes du biais de la RAP : la charge temporelle imposée aux locuteurs de dialectes non standard (« taxation temporelle »), qui n'est pas prise en compte par les mesures d'équité technologiques existantes ; la perturbation du flux conversationnel due à la méconnaissance du système ; et le lien fondamental entre les schémas de parole et l'identité personnelle/culturelle. Il analyse la tension entre standardisation linguistique et pluralisme dans le développement de la RAP, en soutenant que les approches actuelles incarnent et renforcent souvent des idéologies linguistiques problématiques. En fin de compte, l'étude souligne que la lutte contre les biais liés à la reconnaissance automatique de la parole exige plus qu'une simple intervention technologique ; elle nécessite de reconnaître les diverses variantes linguistiques comme des modes d'expression légitimes, dignes d'être acceptés par la technologie. Ce recadrage philosophique suggère une nouvelle voie pour le développement de systèmes de reconnaissance automatique de la parole respectueux de la diversité linguistique et de l'autonomie des locuteurs.

Takeaways, Limitations

Takeaways:
Soulignez que le biais des systèmes ASR n’est pas simplement un problème technique, mais un problème éthique et social.
Présentation des dimensions éthiques uniques du biais ASR (taxation temporelle, perturbation du flux conversationnel et association avec l'identité) qui ne peuvent pas être capturées par les mesures techniques existantes.
Fournir un nouveau cadre philosophique pour développer des systèmes ASR qui respectent la diversité linguistique.
Souligne la nécessité de prendre en compte les considérations sociales et culturelles ainsi que les interventions techniques.
Limitations:
Absence de méthodes de mesure ou de solutions spécifiques pour les dimensions éthiques proposées.
Manque de cas d’analyse spécifiques pour des variantes linguistiques spécifiques.
Des recherches supplémentaires sont nécessaires sur l’applicabilité pratique du cadre philosophique présenté.
👍