Sign In

Looping Back to Move Forward: Recursive Transformers for Efficient and Flexible Large Multimodal Models

Created by
  • Haebom
Category
Empty

μ €μž

Ruihan Xu, Yuting Gao, Lan Wang, Jianing Li, Weihao Chen, Qingpei Guo, Ming Yang, Shiliang Zhang

πŸ’‘ κ°œμš”

λ³Έ μ—°κ΅¬λŠ” λŒ€κ·œλͺ¨ λ©€ν‹°λͺ¨λ‹¬ λͺ¨λΈ(LMM)의 νŒŒλΌλ―Έν„° ν™œμš©λ„λ₯Ό λ†’μ΄κ³ μž, λͺ¨λΈ 크기 증가 없이 νŒŒλΌλ―Έν„°λ₯Ό μž¬μ‚¬μš©ν•˜μ—¬ λ©€ν‹°λͺ¨λ‹¬ ν‘œν˜„μ„ κ°•ν™”ν•˜λŠ” μž¬κ·€μ  κ°•ν™” 기법을 μ œμ•ˆν•©λ‹ˆλ‹€. 이λ₯Ό μœ„ν•΄ μ œμ•ˆλœ RecursiveVLM은 μž¬κ·€ 단계 κ°„ νŠΉμ§• 정렬을 μœ„ν•œ Recursive Connector와 μ„±λŠ₯ ν–₯상을 보μž₯ν•˜λŠ” Monotonic Recursion Lossλ₯Ό λ„μž…ν•˜μ—¬, μ—°μ‚° μžμ›μ΄ μ œν•œλœ ν™˜κ²½μ—μ„œλŠ” 적은 반볡으둜, κ·Έλ ‡μ§€ μ•Šμ€ ν™˜κ²½μ—μ„œλŠ” μ μ§„μ μœΌλ‘œ μ„±λŠ₯을 ν–₯μƒμ‹œν‚€λŠ” μ˜¨λ””λ§¨λ“œ κ°•ν™” λ©”μ»€λ‹ˆμ¦˜μ„ κ΅¬ν˜„ν•©λ‹ˆλ‹€. μ‹€ν—˜ κ²°κ³Ό, ν‘œμ€€ 트랜슀포머 λŒ€λΉ„ 3%p, κΈ°μ‘΄ μž¬κ·€ λͺ¨λΈ λŒ€λΉ„ 7%p의 μΌκ΄€λœ μ„±λŠ₯ ν–₯상을 보여주며 효율적이고 배포 ν™˜κ²½μ— 적응 κ°€λŠ₯ν•œ LMM 개발 κ°€λŠ₯성을 μ œμ‹œν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
μž¬κ·€μ  νŒŒλΌλ―Έν„° μž¬μ‚¬μš©μ„ 톡해 λͺ¨λΈ 크기 증가 없이 LMM의 νš¨μœ¨μ„±κ³Ό μ„±λŠ₯을 ν–₯μƒμ‹œν‚¬ 수 μžˆμŒμ„ μž…μ¦ν–ˆμŠ΅λ‹ˆλ‹€.
β€’
μ˜¨λ””λ§¨λ“œ κ°•ν™” λ©”μ»€λ‹ˆμ¦˜μ€ λ‹€μ–‘ν•œ μ»΄ν“¨νŒ… μžμ› ν™˜κ²½μ— LMM을 μœ μ—°ν•˜κ²Œ μ μš©ν•  수 μžˆλŠ” κ°€λŠ₯성을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
μž¬κ·€ κΉŠμ΄μ— λ”°λ₯Έ μ„±λŠ₯ ν–₯μƒμ˜ μ—„κ²©ν•œ 보μž₯이 μ‹€μ œ λ³΅μž‘ν•œ λ©€ν‹°λͺ¨λ‹¬ νƒœμŠ€ν¬μ—μ„œ μ–Όλ§ˆλ‚˜ νš¨κ³Όμ μΌμ§€μ— λŒ€ν•œ 좔가적인 탐색이 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘