Sign In

SCITUNE: Aligning Large Language Models with Human-Curated Scientific Multimodal Instructions

Created by
  • Haebom
Category
Empty

μ €μž

Sameera Horawalavithana, Sai Munikoti, Ian Stewart, Henry Kvinge, Karl Pazdernik

πŸ’‘ κ°œμš”

λ³Έ 논문은 κ³Όν•™ 뢄야에 νŠΉν™”λœ λ©€ν‹°λͺ¨λ‹¬ μ§€μ‹œ μ‚¬ν•­μœΌλ‘œ λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)을 ν•™μŠ΅μ‹œν‚€λŠ” "SciTune" ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. 이λ₯Ό μœ„ν•΄ λΉ„μ „ 인코더와 LLM을 κ²°ν•©ν•œ λŒ€κ·œλͺ¨ λ©€ν‹°λͺ¨λ‹¬ λͺ¨λΈμΈ LLaMA-SciTune을 κ°œλ°œν•˜μ˜€μœΌλ©°, SciCap, VisText, ScienceQA λ²€μΉ˜λ§ˆν¬μ—μ„œ κΈ°μ‘΄ μ΅œμ‹  λͺ¨λΈ λŒ€λΉ„ μš°μˆ˜ν•œ μ„±λŠ₯을 λ³΄μ—¬μ£Όμ—ˆμŠ΅λ‹ˆλ‹€. μ΄λŠ” μˆ˜λ™μœΌλ‘œ μƒμ„±λœ κ³Όν•™ λ©€ν‹°λͺ¨λ‹¬ μ§€μ‹œ 사항이 ν•©μ„± 데이터에 λΉ„ν•΄ 양은 μ μ§€λ§Œ, κ³Όν•™ λΆ„μ•Ό LLM νŠœλ‹μ— 맀우 νš¨κ³Όμ μž„μ„ μž…μ¦ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
인간이 직접 μƒμ„±ν•œ κ³ ν’ˆμ§ˆμ˜ κ³Όν•™ λ©€ν‹°λͺ¨λ‹¬ μ§€μ‹œ 사항이 LLM의 κ³Όν•™ λΆ„μ•Ό 이해 및 μˆ˜ν–‰ λŠ₯λ ₯을 크게 ν–₯μƒμ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
λ©€ν‹°λͺ¨λ‹¬ 데이터λ₯Ό ν™œμš©ν•œ LLM νŠœλ‹μ€ 기쑴의 ν…μŠ€νŠΈ 기반 νŠœλ‹λ³΄λ‹€ 과학적 지식 μŠ΅λ“ 및 좔둠에 더 νš¨κ³Όμ μž…λ‹ˆλ‹€.
β€’
ν•©μ„± 데이터 기반 νŠœλ‹ λͺ¨λΈμ— λΉ„ν•΄ μ„±λŠ₯이 λ›°μ–΄λ‚˜μ§€λ§Œ, μˆ˜λ™ 데이터 μƒμ„±μ˜ λΉ„μš© 및 μ‹œκ°„ μ œμ•½μœΌλ‘œ 인해 데이터셋 규λͺ¨ 확보에 어렀움이 μžˆμ„ 수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘