Sign In

MM-LIMA: Less Is More for Alignment in Multi-Modal Datasets

Created by
  • Haebom
Category
Empty

μ €μž

Lai Wei, Xiaozhe Li, Zihao Jiang, Weiran Huang, Lichao Sun

πŸ’‘ κ°œμš”

λ³Έ 논문은 닀쀑 λͺ¨λ‹¬ λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)의 νŠœλ‹ κ³Όμ •μ—μ„œ κ³ ν’ˆμ§ˆμ˜ 적은 μ–‘μ˜ 데이터가 μ€‘μš”ν•˜λ‹€λŠ” 점을 κ°•μ‘°ν•˜λ©°, MiniGPT-4에 μ‚¬μš©λœ λ°μ΄ν„°μ˜ 6%에 λΆˆκ³Όν•œ 200개의 μ˜ˆμ‹œλ‘œ νŠœλ‹λœ MM-LIMAλ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. 연ꡬ진은 닀쀑 λͺ¨λ‹¬ λ°μ΄ν„°μ˜ ν’ˆμ§ˆμ„ ν‰κ°€ν•˜λŠ” μ§€ν‘œλ₯Ό κ°œλ°œν•˜κ³ , 이λ₯Ό 기반으둜 μ €ν’ˆμ§ˆ 데이터λ₯Ό ν•„ν„°λ§ν•˜λŠ” μžλ™ 데이터 선택기λ₯Ό μ œμ‹œν•˜μ—¬ MM-LIMAκ°€ MiniGPT-4보닀 μš°μˆ˜ν•œ μ„±λŠ₯을 λ‹¬μ„±ν–ˆμŒμ„ λ³΄μ—¬μ€λ‹ˆλ‹€. μ΄λŠ” 적은 양이라도 κ³ ν’ˆμ§ˆμ˜ 지도 ν•™μŠ΅ 데이터가 닀쀑 λͺ¨λ‹¬ LLM의 μ„±λŠ₯ ν–₯상에 νš¨μœ¨μ μž„μ„ μž…μ¦ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
κ³ ν’ˆμ§ˆμ˜ μ†ŒλŸ‰ 지도 ν•™μŠ΅ 데이터가 닀쀑 λͺ¨λ‹¬ LLM의 μ„±λŠ₯을 크게 ν–₯μƒμ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
μžλ™ν™”λœ 데이터 ν’ˆμ§ˆ 평가 및 필터링 λ©”μ»€λ‹ˆμ¦˜μ€ λͺ¨λΈ νŠœλ‹ νš¨μœ¨μ„±μ„ λ†’μ΄λŠ” 데 μ€‘μš”ν•©λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ 데이터 μ„ νƒκΈ°μ˜ μΌλ°˜ν™” μ„±λŠ₯ 및 λ‹€μ–‘ν•œ 닀쀑 λͺ¨λ‹¬ LLM μ•„ν‚€ν…μ²˜μ— λŒ€ν•œ 적용 κ°€λŠ₯성에 λŒ€ν•œ 좔가적인 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘