Sign In

Frequency-Enhanced Diffusion Models: Curriculum-Guided Semantic Alignment for Zero-Shot Skeleton Action Recognition

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Yuxi Zhou, Zhengbo Zhang, Jingyu Pan, Zhiyu Lin, Zhigang Tu

πŸ’‘ κ°œμš”

λ³Έ 논문은 μ œλ‘œμƒ· 골격 μ•‘μ…˜ 인식(ZSAR)μ—μ„œ λ°œμƒν•˜λŠ” ν™•μ‚° λͺ¨λΈμ˜ 고주파 동적 정보 손싀 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ 주파수 기반의 μƒˆλ‘œμš΄ ν™•μ‚° λͺ¨λΈ(FDSM)을 μ œμ•ˆν•©λ‹ˆλ‹€. μ œμ•ˆλœ FDSM은 의미둠적 κ°€μ΄λ“œ μŠ€νŽ™νŠΈλŸΌ μž”μ°¨ λͺ¨λ“ˆ, νƒ€μž„μŠ€ν… μ μ‘ν˜• μŠ€νŽ™νŠΈλŸΌ 손싀, 컀리큘럼 기반 의미둠적 좔상화λ₯Ό ν†΅ν•©ν•˜μ—¬ λ―Έμ„Έν•œ λ™μž‘ λ””ν…ŒμΌμ„ 효과적으둜 λ³΅μ›ν•©λ‹ˆλ‹€. 이λ₯Ό 톡해 NTU RGB+D, PKU-MMD, Kinetics-skeleton λ°μ΄ν„°μ…‹μ—μ„œ 졜고 μˆ˜μ€€μ˜ μ„±λŠ₯을 λ‹¬μ„±ν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
ν™•μ‚° λͺ¨λΈμ˜ μŠ€νŽ™νŠΈλŸΌ 편ν–₯으둜 μΈν•œ 고주파 정보 손싀 문제λ₯Ό κ·Ήλ³΅ν•˜λŠ” μƒˆλ‘œμš΄ μ ‘κ·Ό 방식을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
μ œλ‘œμƒ· 골격 μ•‘μ…˜ 인식 λΆ„μ•Όμ—μ„œ λ―Έμ„Έν•œ λ™μž‘ λ””ν…ŒμΌμ„ 효과적으둜 ν¬μ°©ν•˜κ³  λ³΅μ›ν•˜λŠ” κ°•λ ₯ν•œ 방법둠을 κ°œλ°œν–ˆμŠ΅λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ 방법둠은 μ—¬λŸ¬ μ£Όμš” λ°μ΄ν„°μ…‹μ—μ„œ μ΅œμ²¨λ‹¨ μ„±λŠ₯을 보여 ZSAR λΆ„μ•Όμ˜ λ°œμ „μ— κΈ°μ—¬ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
ν–₯ν›„ μ—°κ΅¬μ—μ„œλŠ” 더 λ³΅μž‘ν•˜κ³  λ―Έλ¬˜ν•œ μ•‘μ…˜μ— λŒ€ν•œ 인식 μ„±λŠ₯을 ν–₯μƒμ‹œν‚€κΈ° μœ„ν•œ 좔가적인 주파수 뢄석 및 λͺ¨λΈ κ°œμ„ μ΄ ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘