Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Tính công bằng của nhận dạng giọng nói tự động: Nhìn qua lăng kính triết học

Created by
  • Haebom

Tác giả

Anna Seo Kyung Choi, Hoon Choi

Phác thảo

Bài báo này phân tích vấn đề công bằng trong các hệ thống Nhận dạng Giọng nói Tự động (ASR) từ góc độ triết học. Bài báo lập luận rằng việc nhận dạng sai một cách có hệ thống một số biến thể ngôn ngữ vượt ra ngoài những hạn chế kỹ thuật đơn thuần và thể hiện một hình thức thiếu tôn trọng, làm trầm trọng thêm những bất công trong lịch sử đối với các cộng đồng ngôn ngữ thiểu số. Phân biệt giữa phân loại trung lập về mặt đạo đức (phân biệt đối xử1) và phân biệt đối xử có hại (phân biệt đối xử2), bài báo chứng minh rằng việc nhận dạng sai liên tục các phương ngữ phi chuẩn có thể leo thang từ phân loại trước sang phân loại sau. Hơn nữa, bài báo xác định ba khía cạnh đạo đức riêng biệt của định kiến ASR: gánh nặng thời gian áp đặt lên người nói các phương ngữ phi chuẩn ("thuế tạm thời"), điều này không được đo lường bằng các thước đo công bằng công nghệ hiện có; sự gián đoạn dòng hội thoại do nhận dạng sai của hệ thống; và mối liên hệ cơ bản giữa các mẫu giọng nói và bản sắc cá nhân/văn hóa. Bài báo phân tích sự căng thẳng giữa chuẩn hóa ngôn ngữ và chủ nghĩa đa nguyên trong quá trình phát triển ASR, lập luận rằng các phương pháp tiếp cận hiện tại thường bao hàm và củng cố các hệ tư tưởng ngôn ngữ có vấn đề. Cuối cùng, bài báo nhấn mạnh rằng việc giải quyết định kiến ASR đòi hỏi nhiều hơn là sự can thiệp của công nghệ; nó đòi hỏi việc công nhận các biến thể ngôn ngữ đa dạng là những phương thức biểu đạt hợp pháp, xứng đáng được công nghệ chấp nhận. Sự định hình lại về mặt triết lý này gợi ý một con đường mới để phát triển các hệ thống ASR tôn trọng sự đa dạng ngôn ngữ và quyền tự chủ của người nói.

Takeaways, Limitations

Takeaways:
Nhấn mạnh rằng sự thiên vị của hệ thống ASR không chỉ đơn thuần là vấn đề kỹ thuật mà còn là vấn đề đạo đức và xã hội.
Trình bày các khía cạnh đạo đức độc đáo của sự thiên vị ASR (thuế tạm thời, gián đoạn luồng hội thoại và liên kết với danh tính) mà các số liệu kỹ thuật hiện có không thể nắm bắt được.
Cung cấp khuôn khổ triết học mới để phát triển các hệ thống ASR tôn trọng sự đa dạng ngôn ngữ.
Nhấn mạnh nhu cầu cân nhắc về mặt xã hội và văn hóa cũng như các can thiệp kỹ thuật.
Limitations:
Thiếu phương pháp đo lường hoặc giải pháp cụ thể cho các khía cạnh đạo đức được đề xuất.
Thiếu các trường hợp phân tích cụ thể cho các biến thể ngôn ngữ cụ thể.
Cần có thêm nghiên cứu về tính ứng dụng thực tế của khuôn khổ triết học được trình bày.
👍