Sign In

Towards Open World Sound Event Detection

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

P. H. Hai, L. T. Minh, L. H. Son

πŸ’‘ κ°œμš”

λ³Έ 논문은 ν˜„μ‹€ μ„Έκ³„μ—μ„œ λ°œμƒν•˜λŠ” μƒˆλ‘­κ³  μ˜ˆμƒμΉ˜ λͺ»ν•œ μ†Œλ¦¬ 이벀트λ₯Ό νƒμ§€ν•˜κΈ° μœ„ν•œ 'κ°œλ°©ν˜• 세계 μ†Œλ¦¬ 이벀트 탐지(OW-SED)' νŒ¨λŸ¬λ‹€μž„μ„ μ œμ•ˆν•©λ‹ˆλ‹€. μ œμ•ˆλœ 1D λ³€ν˜• μ–΄ν…μ…˜(Deformable Attention) 기반 λͺ¨λΈκ³Ό νŠΉμ§• 뢄리, λ‹€μ–‘μ„± 손싀 ν•¨μˆ˜λ₯Ό ν¬ν•¨ν•˜λŠ” WOOT(Open-World Deformable Sound Event Detection Transformer) ν”„λ ˆμž„μ›Œν¬λŠ” μ•Œλ €μ§„ 이벀트λ₯Ό νƒμ§€ν•˜κ³ , 보지 λͺ»ν•œ 이벀트λ₯Ό μ‹λ³„ν•˜λ©°, 이λ₯Ό μ μ§„μ μœΌλ‘œ ν•™μŠ΅ν•˜λŠ” λŠ₯λ ₯을 κ°–μΆ₯λ‹ˆλ‹€. μ‹€ν—˜ κ²°κ³Ό, κΈ°μ‘΄ νμ‡„ν˜• 세계 μ„€μ •μ—μ„œ μš°μˆ˜ν•œ μ„±λŠ₯을 λ³΄μ˜€μ„ 뿐만 μ•„λ‹ˆλΌ, κ°œλ°©ν˜• 세계 μ‹œλ‚˜λ¦¬μ˜€μ—μ„œ κΈ°μ‘΄ λͺ¨λΈ λŒ€λΉ„ μƒλ‹Ήν•œ μ„±λŠ₯ ν–₯상을 λ‹¬μ„±ν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
μ‹€μ‹œκ°„μœΌλ‘œ λ°œμƒν•˜λŠ” λ‹€μ–‘ν•œ μ†Œλ¦¬ 이벀트λ₯Ό 효과적으둜 κ°μ§€ν•˜μ—¬ 슀마트 ν™˜κ²½μ—μ„œμ˜ μ‘μš©μ„±μ„ λ†’μž…λ‹ˆλ‹€.
β€’
기쑴의 'λ‹«νžŒ 세계' λͺ¨λΈμ΄ κ°€μ§„ ν•œκ³„λ₯Ό κ·Ήλ³΅ν•˜κ³ , 예츑 λΆˆκ°€λŠ₯ν•œ μƒν™©μ—μ„œμ˜ AI μ‹œμŠ€ν…œ μ„±λŠ₯을 ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€.
β€’
κ°œλ°©ν˜• 세계 μ‹œλ‚˜λ¦¬μ˜€μ—μ„œμ˜ 이벀트 탐지 및 ν•™μŠ΅ λ©”μ»€λ‹ˆμ¦˜μ„ λ”μš± μ •κ΅ν•˜κ²Œ 닀듬고, λ‹€μ–‘ν•œ μ’…λ₯˜μ˜ λͺ¨ν˜Έν•˜κ±°λ‚˜ μ€‘μ²©λœ μ΄λ²€νŠΈμ— λŒ€ν•œ 강건성을 ν™•λ³΄ν•˜λŠ” 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘