Sign In

Symphony for Speech-to-Text: Supporting Real-Time Medical Voice Interfaces

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Arne Nix, Robert James, Lasse Borgholt, Anna B. Ekner, Lana Krumm, Julius Severin, Dan Engel, Lars Maal{\o}e, Jakob Havtorn

πŸ’‘ κ°œμš”

λ³Έ 논문은 의료 ν™˜κ²½μ—μ„œμ˜ μ‹€μ‹œκ°„ μŒμ„±-ν…μŠ€νŠΈ λ³€ν™˜(Speech-to-Text, STT)의 어렀움을 ν•΄κ²°ν•˜κΈ° μœ„ν•΄ "Symphony for Speech-to-Text"λΌλŠ” μƒˆλ‘œμš΄ μ‹œμŠ€ν…œμ„ μ œμ•ˆν•©λ‹ˆλ‹€. 이 μ‹œμŠ€ν…œμ€ μ „λ¬Έ μš©μ–΄, λ§₯락적 λͺ¨ν˜Έμ„±, μΈ‘μ •κ°’, μ•½μ–΄ 등을 μ •ν™•ν•˜κ²Œ μ²˜λ¦¬ν•˜λ©°, μ‹€μ‹œκ°„ 슀트리밍 및 배치 파일 처리λ₯Ό λͺ¨λ‘ μ§€μ›ν•˜λ„λ‘ μ„€κ³„λ˜μ—ˆμŠ΅λ‹ˆλ‹€. μ—¬λŸ¬ 벀치마크 λ°μ΄ν„°μ…‹μ—μ„œ κΈ°μ‘΄ μ΅œμ‹  기술 λŒ€λΉ„ μš°μˆ˜ν•œ μ„±λŠ₯을 μž…μ¦ν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
의료 λΆ„μ•Όμ˜ μ•ˆμ „μ΄ μ€‘μš”ν•œ ν™˜κ²½μ—μ„œ μ‹ λ’°ν•  수 μžˆλŠ” μŒμ„± μΈν„°νŽ˜μ΄μŠ€ ꡬ좕을 μœ„ν•œ μƒˆλ‘œμš΄ κ°€λŠ₯성을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
일반 λ„λ©”μΈμ—μ„œλ„ 경쟁λ ₯ μžˆλŠ” μ„±λŠ₯을 보여, λ‹€μ–‘ν•œ μž„μƒ μ›Œν¬ν”Œλ‘œμš°μ— μœ μ—°ν•˜κ²Œ 적용될 수 μžˆμŒμ„ μ‹œμ‚¬ν•©λ‹ˆλ‹€.
β€’
λ‹€μ–‘ν•œ μ‚¬μš© 사둀에 μ μ‘ν•˜λŠ” λŠ₯λ ₯은 의료 μŒμ„± 인식 기술의 λ°œμ „μ— κΈ°μ—¬ν•  κ²ƒμœΌλ‘œ κΈ°λŒ€λ©λ‹ˆλ‹€.
β€’
μ‹€μ œ μž„μƒ ν˜„μž₯μ—μ„œμ˜ κ΄‘λ²”μœ„ν•œ 검증 및 λ‹€μ–‘ν•œ 언어에 λŒ€ν•œ 지원 ν™•λŒ€κ°€ ν–₯ν›„ κ³Όμ œμž…λ‹ˆλ‹€.
πŸ‘