Sign In

Two-Dimensional Quantization for Geometry-Aware Audio Coding

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Tal Shuster, Eliya Nachmani

πŸ’‘ κ°œμš”

λ³Έ 논문은 κΈ°μ‘΄ 신경망 기반 μ˜€λ””μ˜€ μ½”λ±μ—μ„œ μ‚¬μš©λ˜λŠ” μ–‘μžν™” 방식듀이 잠재 κ³΅κ°„μ˜ κΈ°ν•˜ν•™μ  ꡬ쑰λ₯Ό μ œν•œν•˜μ—¬ ν‘œν˜„ ν•™μŠ΅ 및 μ½”λ“œλΆ ν™œμš©μ˜ λΉ„νš¨μœ¨μ„±μ„ μ΄ˆλž˜ν•˜λŠ” 문제λ₯Ό ν•΄κ²°ν•˜κ³ μž ν•©λ‹ˆλ‹€. 이λ₯Ό μœ„ν•΄ νŠΉμ§• μŒμ„ 2차원 격자(μœ‘κ°ν˜•, λ§ˆλ¦„λͺ¨, μ§μ‚¬κ°ν˜• λ“±)에 νˆ¬μ˜ν•˜κ³  κ°€μž₯ κ°€κΉŒμš΄ 격자 κ°’μœΌλ‘œ μ–‘μžν™”ν•˜λŠ” μƒˆλ‘œμš΄ 2차원 μ–‘μžν™”(Q2D2) 기법을 μ œμ•ˆν•©λ‹ˆλ‹€. Q2D2λŠ” κΈ°μ‘΄ 방식과 μœ μ‚¬ν•œ μ½”λ“œλΆ 크기λ₯Ό μœ μ§€ν•˜λ©΄μ„œλ„ μ €λ ΄ν•œ 토큰 λΉ„μœ¨κ³Ό 높은 μ½”λ“œλΆ ν™œμš©λ„λ₯Ό λ‹¬μ„±ν•˜μ—¬ μ˜€λ””μ˜€ μ••μΆ• νš¨μœ¨μ„±μ„ ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
κΈ°ν•˜ν•™μ  ꡬ쑰λ₯Ό ν™œμš©ν•œ μ–‘μžν™” νš¨μœ¨μ„± μ¦λŒ€: 잠재 κ³΅κ°„μ˜ κΈ°ν•˜ν•™μ  ꡬ쑰λ₯Ό λͺ…μ‹œμ μœΌλ‘œ κ³ λ €ν•˜μ—¬ νŠΉμ§• κ°„ 상관관계λ₯Ό 효과적으둜 ν¬μ°©ν•˜κ³ , 이λ₯Ό 톡해 ν‘œν˜„ ν•™μŠ΅ 및 μ½”λ“œλΆ ν™œμš©μ˜ νš¨μœ¨μ„±μ„ λ†’μ˜€μŠ΅λ‹ˆλ‹€.
β€’
μƒνƒœ-졜고 μˆ˜μ€€μ˜ 볡원 ν’ˆμ§ˆ μœ μ§€: μ œμ•ˆλœ Q2D2 기법은 μŒμ„±, μ˜€λ””μ˜€, μŒμ•… λ“± λ‹€μ–‘ν•œ λ„λ©”μΈμ—μ„œ 기쑴의 μ΅œμ²¨λ‹¨ λͺ¨λΈκ³Ό λΉ„κ΅ν•˜μ—¬ 경쟁λ ₯ μžˆκ±°λ‚˜ μš°μˆ˜ν•œ 객관적 및 주관적 볡원 μ„±λŠ₯을 λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
ν™•μž₯μ„± 및 μΌλ°˜ν™” κ°€λŠ₯μ„±: μ œμ•ˆλœ Q2D2λŠ” κ°„λ‹¨ν•œ κΈ°ν•˜ν•™μ  ꡬ쑰λ₯Ό 기반으둜 ν•˜λ©°, λ‹€μ–‘ν•œ μ‹€ν—˜μ„ 톡해 섀계 μ„ νƒμ˜ νš¨κ³Όκ°€ μž…μ¦λ˜μ–΄ ν–₯ν›„ μ˜€λ””μ˜€ μ½”λ”© λΆ„μ•Όμ˜ λ°œμ „μ— κΈ°μ—¬ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘