Sign In

Task-Lens: Cross-Task Utility Based Speech Dataset Profiling for Low-Resource Indian Languages

Created by
  • Haebom
Category
Empty

์ €์ž

Swati Sharma, Divya V. Sharma, Anubha Gupta

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ๋…ผ๋ฌธ์€ ์ธ๋„ ์ €์ž์› ์–ธ์–ด์˜ ํฌ๊ด„์ ์ธ ์Œ์„ฑ ๊ธฐ์ˆ  ๊ฐœ๋ฐœ์„ ์œ„ํ•ด ๊ธฐ์กด ์Œ์„ฑ ๋ฐ์ดํ„ฐ์…‹์˜ ๋‹ค์–‘ํ•œ ๋‹ค์šด์ŠคํŠธ๋ฆผ ํƒœ์Šคํฌ์— ๋Œ€ํ•œ ํ™œ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ํ‰๊ฐ€ํ•˜๋Š” "Task-Lens"๋ผ๋Š” ์ƒˆ๋กœ์šด ํฌ๋กœ์Šค ํƒœ์Šคํฌ ํ”„๋กœํŒŒ์ผ๋ง ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. 50๊ฐœ์˜ ์ธ๋„ ์Œ์„ฑ ๋ฐ์ดํ„ฐ์…‹๊ณผ 26๊ฐœ ์–ธ์–ด๋ฅผ ๋Œ€์ƒ์œผ๋กœ 9๊ฐ€์ง€ ๋‹ค์šด์ŠคํŠธ๋ฆผ ํƒœ์Šคํฌ์— ๋Œ€ํ•œ ๋ฐ์ดํ„ฐ์…‹์˜ ์ค€๋น„ ์ƒํƒœ๋ฅผ ๋ถ„์„ํ•˜์—ฌ, ์ˆจ๊ฒจ์ง„ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•˜๊ณ  ํ™œ์šฉ๋„๊ฐ€ ๋‚ฎ์€ ํƒœ์Šคํฌ์™€ ์–ธ์–ด๋ฅผ ์‹๋ณ„ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์—ฐ๊ตฌ์ž๋“ค์ด ๊ธฐ์กด ๋ฐ์ดํ„ฐ์…‹์˜ ํ™•์žฅ ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ํƒ์ƒ‰ํ•˜๊ณ  ๋ฐ์ดํ„ฐ์…‹ ์ƒ์„ฑ์„ ์šฐ์„ ์ˆœ์œ„ํ™”ํ•  ์ˆ˜ ์žˆ๋„๋ก ์ง€์›ํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
๊ธฐ์กด ์Œ์„ฑ ๋ฐ์ดํ„ฐ์…‹์— ํฌํ•จ๋œ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ๋ฅผ ์ ๊ทน์ ์œผ๋กœ ํ™œ์šฉํ•˜๋ฉด ๋‹จ์ผ ํƒœ์Šคํฌ์— ๊ตญํ•œ๋˜์ง€ ์•Š๊ณ  ์—ฌ๋Ÿฌ ๋‹ค์šด์ŠคํŠธ๋ฆผ ํƒœ์Šคํฌ์— ์ ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
โ€ข
Task-Lens ๋ฐฉ๋ฒ•๋ก ์€ ์ธ๋„์™€ ๊ฐ™์ด ์–ธ์–ด์ ์œผ๋กœ ๋‹ค์–‘ํ•œ ์ €์ž์› ํ™˜๊ฒฝ์—์„œ ๋ฐ์ดํ„ฐ์…‹ ํ™œ์šฉ๋„๋ฅผ ๊ทน๋Œ€ํ™”ํ•˜๊ณ  ์—ฐ๊ตฌ์˜ ํšจ์œจ์„ฑ์„ ๋†’์ด๋Š” ๋ฐ ๊ธฐ์—ฌํ•ฉ๋‹ˆ๋‹ค.
โ€ข
ํ˜„์žฌ ์ž์›์ด ๋ถ€์กฑํ•œ ํŠน์ • ๋‹ค์šด์ŠคํŠธ๋ฆผ ํƒœ์Šคํฌ์™€ ์ธ๋„ ์–ธ์–ด์— ๋Œ€ํ•œ ๋ฐ์ดํ„ฐ์…‹ ์ƒ์„ฑ์„ ์šฐ์„ ์ ์œผ๋กœ ๊ณ ๋ คํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.
โ€ข
๋ณธ ์—ฐ๊ตฌ๋Š” 50๊ฐœ์˜ ๋ฐ์ดํ„ฐ์…‹๋งŒ์„ ๋Œ€์ƒ์œผ๋กœ ํ•˜์˜€์œผ๋ฏ€๋กœ, ๋” ๊ด‘๋ฒ”์œ„ํ•œ ๋ฐ์ดํ„ฐ์…‹์— ๋Œ€ํ•œ ํ‰๊ฐ€์™€ ๋” ๋‹ค์–‘ํ•œ ๋‹ค์šด์ŠคํŠธ๋ฆผ ํƒœ์Šคํฌ๋ฅผ ๊ณ ๋ คํ•œ ํ›„์† ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๐Ÿ‘