Sign In

LQA: A Lightweight Quantized-Adaptive Framework for Vision-Language Models on the Edge

Created by
  • Haebom
Category
Empty

μ €μž

Xin Wang, Hualin Zhou, Sheng Guang Wang, Ting Dang, Yu Zhang, Hong Jia, Tao Gu

πŸ’‘ κ°œμš”

λ³Έ 논문은 μ—£μ§€ λ””λ°”μ΄μŠ€μ˜ μžμ› μ œμ•½κ³Ό 뢄포 변화에 λ”°λ₯Έ μ„±λŠ₯ μ €ν•˜ 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ LQAλΌλŠ” κ²½λŸ‰ μ–‘μžν™” 적응 ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. LQAλŠ” λͺ¨λ‹¬λ¦¬ν‹° 인식 μ–‘μžν™” μ „λž΅κ³Ό κ·Έλž˜λ””μ–ΈνŠΈ μ—†λŠ” ν…ŒμŠ€νŠΈ μ‹œκ°„ 적응을 κ²°ν•©ν•˜μ—¬, μžμ› μ œμ•½μ μΈ ν•˜λ“œμ›¨μ–΄μ—μ„œλ„ κ°•λ ₯ν•˜κ³  효율적인 VLM 배포λ₯Ό κ°€λŠ₯ν•˜κ²Œ ν•©λ‹ˆλ‹€. μ‹€ν—˜ κ²°κ³Ό, LQAλŠ” μ „λ°˜μ μΈ 적응 μ„±λŠ₯을 4.5% ν–₯μƒμ‹œν‚€κ³  λ©”λͺ¨λ¦¬ μ‚¬μš©λŸ‰μ„ 크게 쀄여, μ—£μ§€ λ””λ°”μ΄μŠ€μ—μ„œμ˜ VLM 배포λ₯Ό μœ„ν•œ μ‹€μš©μ μΈ 해결책을 μ œμ‹œν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
μ—£μ§€ λ””λ°”μ΄μŠ€ ν™˜κ²½μ—μ„œ Vision-Language Models(VLMs)의 μ„±λŠ₯ μ €ν•˜ 문제λ₯Ό 효과적으둜 ν•΄κ²°ν•  수 μžˆλŠ” κ²½λŸ‰ ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€.
β€’
κ·Έλž˜λ””μ–ΈνŠΈ μ—†λŠ” ν…ŒμŠ€νŠΈ μ‹œκ°„ 적응 기법과 λͺ¨λ‹¬λ¦¬ν‹° 인식 μ–‘μžν™”λ₯Ό κ²°ν•©ν•˜μ—¬, μžμ› μ œμ•½μ μΈ ν™˜κ²½μ—μ„œλ„ 높은 적응 μ„±λŠ₯κ³Ό νš¨μœ¨μ„±μ„ λ‹¬μ„±ν•©λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ LQA ν”„λ ˆμž„μ›Œν¬λŠ” 기쑴의 κ·Έλž˜λ””μ–ΈνŠΈ 기반 TTA 방법 λŒ€λΉ„ λ©”λͺ¨λ¦¬ μ‚¬μš©λŸ‰μ„ 획기적으둜 쀄여 μ—£μ§€ AI 배포의 μ‹€μš©μ„±μ„ λ†’μž…λ‹ˆλ‹€.
β€’
ν–₯ν›„ μ—°κ΅¬μ—μ„œλŠ” λ‹€μ–‘ν•œ μ—£μ§€ λ””λ°”μ΄μŠ€ μ•„ν‚€ν…μ²˜μ— λŒ€ν•œ μ΅œμ ν™” 및 λ”μš± λ³΅μž‘ν•œ 뢄포 λ³€ν™” μ‹œλ‚˜λ¦¬μ˜€μ— λŒ€ν•œ 적용 κ°€λŠ₯성을 탐색할 ν•„μš”κ°€ μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘