Sign In

RAS: a Reliability Oriented Metric for Automatic Speech Recognition

Created by
  • Haebom
Category
Empty

μ €μž

Wenbin Huang, Yuhang Qiu, Bohan Li, Yiwei Guo, Jing Peng, Hankun Wang, Xie Chen, Kai Yu

πŸ’‘ κ°œμš”

λ³Έ 논문은 μžλ™ μŒμ„± 인식(ASR) μ‹œμŠ€ν…œμ΄ μž‘μŒμ΄λ‚˜ λͺ¨ν˜Έν•œ ν™˜κ²½μ—μ„œ 확신에 μ°¬ 였λ₯˜λ₯Ό μƒμ„±ν•˜λŠ” 문제λ₯Ό ν•΄κ²°ν•˜κ³ μž ν•©λ‹ˆλ‹€. 이λ₯Ό μœ„ν•΄ ASR λͺ¨λΈμ΄ λΆˆν™•μ‹€ν•œ ꡬ간에 λŒ€ν•΄ λͺ…μ‹œμ μœΌλ‘œ κΈ°κΆŒν•  수 μžˆλŠ” abstention-aware ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•˜λ©°, 기ꢌ μƒν™©μ—μ„œμ˜ 신뒰도λ₯Ό ν‰κ°€ν•˜κΈ° μœ„ν•œ μƒˆλ‘œμš΄ μ§€ν‘œμΈ RAS(Reliability-Oriented Metric)λ₯Ό μ†Œκ°œν•©λ‹ˆλ‹€. RASλŠ” 정보성과 였λ₯˜ νšŒν”Όλ₯Ό κ· ν˜• 있게 κ³ λ €ν•˜λ©°, μ‹€ν—˜ κ²°κ³Ό μ œμ•ˆλœ abstention-aware ASR λͺ¨λΈμ΄ 정확도λ₯Ό μœ μ§€ν•˜λ©΄μ„œλ„ μŒμ„± 인식 결과의 신뒰성을 크게 ν–₯μƒμ‹œν‚€λŠ” κ²ƒμœΌλ‘œ λ‚˜νƒ€λ‚¬μŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
ASR μ‹œμŠ€ν…œμ˜ 였λ₯˜μ— λŒ€ν•œ 신뒰도 평가 μ§€ν‘œ λΆ€μž¬λ₯Ό ν•΄κ²°ν•˜κ³ , 확신에 μ°¬ 잘λͺ»λœ 전사λ₯Ό 쀄여 μ‚¬μš©μž 및 λ‹€μš΄μŠ€νŠΈλ¦Ό μ• ν”Œλ¦¬μΌ€μ΄μ…˜μ˜ μ˜€ν•΄λ₯Ό λ°©μ§€ν•©λ‹ˆλ‹€.
β€’
abstention-aware ν”„λ ˆμž„μ›Œν¬λ₯Ό 톡해 ASR λͺ¨λΈμ΄ λΆˆν™•μ‹€ν•œ ꡬ간을 μΈμ‹ν•˜κ³  κΈ°κΆŒν•¨μœΌλ‘œμ¨ μ „λ°˜μ μΈ 신뒰도λ₯Ό 높일 수 μžˆμŒμ„ λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ RAS μ§€ν‘œλŠ” 정보성과 였λ₯˜ νšŒν”Ό κ°„μ˜ κ· ν˜•μ„ κ³ λ €ν•˜λ©°, 인간 μ„ ν˜Έλ„μ— 따라 쑰정될 수 μžˆλŠ” μœ μ—°μ„±μ„ κ°€μ§‘λ‹ˆλ‹€.
β€’
abstention-aware ASR λͺ¨λΈμ˜ ν•™μŠ΅ 과정에 지도 ν•™μŠ΅ 기반 λΆ€νŠΈμŠ€νŠΈλž©ν•‘κ³Ό κ°•ν™” ν•™μŠ΅μ„ μ μš©ν•˜μ—¬ μ„±λŠ₯을 ν–₯μƒμ‹œμΌ°μŠ΅λ‹ˆλ‹€.
β€’
abstention-aware ASR λͺ¨λΈμ˜ λ³΅μž‘μ„± 증가 및 μ‹€μ œ 적용 μ‹œμ˜ 계산 λΉ„μš© 증가에 λŒ€ν•œ κ³ λ €κ°€ ν•„μš”ν•©λ‹ˆλ‹€.
β€’
abstention-aware ASR λͺ¨λΈμ΄ κΈ°κΆŒν•˜λŠ” "λΆˆν™•μ‹€ν•œ" 기쀀을 λͺ…ν™•νžˆ ν•˜κ³ , λ‹€μ–‘ν•œ ν™˜κ²½μ—μ„œμ˜ μ„±λŠ₯ 검증이 μΆ”κ°€μ μœΌλ‘œ μš”κ΅¬λ©λ‹ˆλ‹€.
πŸ‘