Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

TEDxTN: A Three-way Speech Translation Corpus for Code-Switched Tunisian Arabic - English

Created by
  • Haebom
Category
Empty

저자

Fethi Bougares, Salima Mdhaffar, Haroun Elleuch, Yannick Esteve

개요

본 논문은 튀니지 아랍어-영어 음성 번역 데이터셋인 TEDxTN을 최초로 공개합니다. 튀니지 방언 데이터 희소성 문제를 해결하기 위한 노력의 일환으로, 108개의 TEDx 강연을 수집, 분할, 전사 및 번역했습니다. 이 데이터셋은 25시간 분량의 음성을 포함하며, 다양한 튀니지 지역 출신 화자들의 코드 스위칭을 담고 있습니다. 또한, 주석 지침과 함께 공개하여 TEDxTN의 확장을 용이하게 했습니다. 여러 사전 훈련된 엔드투엔드 모델을 사용한 음성 인식 및 음성 번역에 대한 강력한 기준 시스템 결과도 보고합니다. 이 데이터셋은 코드 스위칭 튀니지 방언에 대한 최초의 오픈 소스 음성 번역 데이터셋입니다.

시사점, 한계점

튀니지 방언의 자연어 처리에 대한 추가 연구를 촉진하고 용이하게 할 수 있는 귀중한 자원 제공
TEDxTN 데이터셋 공개를 통해 해당 분야 연구 활성화 기대
데이터셋 확장을 위한 주석 지침 공개
제공된 데이터셋의 규모가 상대적으로 작을 수 있음 (25시간)
특정 연설자 및 억양에 편향될 가능성
👍