Sign In

Words & Weights: Streamlining Multi-Turn Interactions via Co-Adaptation

Created by
  • Haebom
Category
Empty

μ €μž

Chenxing Wei, Hong Wang, Ying He, Zhongxiang Dai, Bo Jiang, F. Richard Yu, Yao Shu

πŸ’‘ κ°œμš”

λ³Έ 논문은 λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)이 닀단계 μƒν˜Έμž‘μš© 쀑 동적인 μ‚¬μš©μž μš”κ΅¬μ— μ μ‘ν•˜λŠ” 것을 λͺ©ν‘œλ‘œ ν•˜λŠ” ν…ŒμŠ€νŠΈ μ‹œκ°„ μ •μ±… 적응(T2PAM)의 μ€‘μš”μ„±μ„ κ°•μ‘°ν•©λ‹ˆλ‹€. κΈ°μ‘΄ 방식듀이 ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§μ΄λ‚˜ ν…ŒμŠ€νŠΈ μ‹œκ°„ ν•™μŠ΅ 쀑 ν•˜λ‚˜μ—λ§Œ μ§‘μ€‘ν•˜λŠ” 반면, λ³Έ μ—°κ΅¬λŠ” μƒν˜Έμž‘μš© μ‹€νŒ¨κ°€ λͺ¨ν˜Έμ„±κ³Ό λŠ₯λ ₯ λΆ€μ‘±μ˜ 볡합적인 κ²°κ³Όμž„μ„ μ§€μ ν•©λ‹ˆλ‹€. 이에 따라, ROSA2 ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•˜μ—¬ 단어와 κ°€μ€‘μΉ˜λ₯Ό λ™μ‹œμ— μ΅œμ ν™”ν•˜λŠ” 곡동 적응 방식을 톡해 μ΄λŸ¬ν•œ 문제λ₯Ό ν•΄κ²°ν•˜κ³ μž ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
ν…μŠ€νŠΈ λ§₯락(단어)의 λͺ…ν™•μ„± κ°œμ„ μ΄ λͺ¨λΈ κ°€μ€‘μΉ˜(νŒŒλΌλ―Έν„°) μ—…λ°μ΄νŠΈμ˜ 효과λ₯Ό 크게 ν–₯μƒμ‹œν‚¬ 수 μžˆλ‹€λŠ” 점을 μ‹œμ‚¬ν•©λ‹ˆλ‹€.
β€’
ROSA2λŠ” ν…μŠ€νŠΈ κ·Έλž˜λ””μ–ΈνŠΈμ™€ νŒŒλΌλ―Έν„° μ—…λ°μ΄νŠΈλ₯Ό κ²°ν•©ν•œ 곡동 적응 μ „λž΅μ„ 톡해 μ‚¬μš©μž μ˜λ„μ˜ λͺ¨ν˜Έμ„±μ„ ν•΄κ²°ν•˜κ³  λͺ¨λΈμ˜ λŠ₯λ ₯ 뢀쑱을 λ³΄μ™„ν•˜μ—¬ 효율적인 적응을 κ°€λŠ₯ν•˜κ²Œ ν•©λ‹ˆλ‹€.
β€’
μƒν˜Έμž‘μš© 횟수λ₯Ό μ€„μ΄λ©΄μ„œλ„ μ„±λŠ₯을 크게 ν–₯μƒμ‹œν‚€λŠ” ROSA2의 검증은, λ‹¨μˆœνžˆ ν”„λ‘¬ν”„νŠΈ μˆ˜μ •μ΄λ‚˜ νŒŒλΌλ―Έν„° μ‘°μ •λ§ŒμœΌλ‘œλŠ” λ‹¬μ„±ν•˜κΈ° μ–΄λ €μš΄ μ‹œλ„ˆμ§€ 효과λ₯Ό λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
ROSA2의 이둠적 증λͺ…은 곡동 적응이 μˆ˜λ ΄μ„ μœ„ν•œ νŒŒλΌλ―Έν„° λ³€κ²½λŸ‰μ„ μ—„κ²©ν•˜κ²Œ 쀄일 수 μžˆμŒμ„ λ³΄μž…λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ ν”„λ ˆμž„μ›Œν¬κ°€ MATH λ°μ΄ν„°μ…‹μ—μ„œ 30%의 μ„±λŠ₯ ν–₯상과 40%의 μƒν˜Έμž‘μš© ν„΄ κ°μ†Œλ₯Ό λ‹¬μ„±ν•˜λ©° κΈ°μ‘΄ μ΅œμ‹  기법듀을 λŠ₯κ°€ν–ˆμŠ΅λ‹ˆλ‹€.
β€’
ν˜„μž¬ μ—°κ΅¬λŠ” νŠΉμ • νƒœμŠ€ν¬(MATH) 및 데이터셋에 λŒ€ν•œ μ‹€ν—˜ κ²°κ³Όλ₯Ό μ œμ‹œν•˜κ³  있으며, λ‹€μ–‘ν•œ 도메인 및 λ³΅μž‘ν•œ μƒν˜Έμž‘μš© μ‹œλ‚˜λ¦¬μ˜€μ—μ„œμ˜ μΌλ°˜ν™” μ„±λŠ₯ 검증이 ν–₯ν›„ 과제둜 λ‚¨μ•„μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘