Sign In

When2Speak: A Dataset for Temporal Participation and Turn-Taking in Multi-Party Conversations for Large Language Models

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Vihaan Nama, Shreya Mendi, Zian Ye, Brinnae Bent

πŸ’‘ κ°œμš”

λ³Έ 논문은 λ‹€μžκ°„ λŒ€ν™”μ—μ„œ μ–Έμ œ λ°œμ–Έν•΄μ•Ό ν•˜λŠ”μ§€κ°€ 무엇을 λ§ν•˜λŠ”μ§€λ§ŒνΌ μ€‘μš”ν•˜λ‹€λŠ” 점에 μ£Όλͺ©ν•˜μ—¬, LLM의 λ°œμ–Έ μ‹œμ  ν•™μŠ΅μ„ μœ„ν•œ "When2Speak"μ΄λΌλŠ” 데이터셋과 생성 νŒŒμ΄ν”„λΌμΈμ„ μ œμ•ˆν•©λ‹ˆλ‹€. 이 데이터셋은 2~6λͺ…μ˜ ν™”μžκ°€ μ°Έμ—¬ν•˜λŠ” 16,000개의 λŒ€ν™”μ—μ„œ νŒŒμƒλœ 215,000개 μ΄μƒμ˜ μ˜ˆμ‹œλ₯Ό ν¬ν•¨ν•˜λ©°, λ°œμ–Έ κ²°μ •(SPEAK vs. SILENT)을 λͺ…μ‹œμ μœΌλ‘œ λͺ¨λΈλ§ν•©λ‹ˆλ‹€. When2Speak 데이터셋을 μ΄μš©ν•œ 지도 λ―Έμ„Έ μ‘°μ •(SFT)은 μ œλ‘œμƒ· λͺ¨λΈλ³΄λ‹€ λ›°μ–΄λ‚œ μ„±λŠ₯을 λ³΄μ˜€μ§€λ§Œ, λͺ¨λΈλ“€μ΄ κ³Όλ„ν•˜κ²Œ μ‹ μ€‘ν•˜μ—¬ λ°œμ–Έ 기회λ₯Ό λ†“μΉ˜λŠ” κ²½ν–₯이 λ°œκ²¬λ˜μ—ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
LLM은 λ‹€μžκ°„ λŒ€ν™”μ—μ„œ λ°œμ–Έ μ‹œμ μ„ λ°°μš°λŠ” 것이 κ°€λŠ₯ν•˜λ©°, 이λ₯Ό μœ„ν•΄ "When2Speak"κ³Ό 같은 ν•©μ„± 데이터셋이 효과적인 μ ‘κ·Ό 방식이 될 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
λ°œμ–Έ μ‹œμ  ν•™μŠ΅μ€ λŒ€ν™” μ§€λŠ₯의 독립적인 ν•™μŠ΅ κ°€λŠ₯ν•œ 차원이며, κ°•ν™” ν•™μŠ΅κ³Ό λΉ„λŒ€μΉ­ 보상 섀계λ₯Ό 톡해 λͺ¨λΈμ˜ λ°œμ–Έ 기회 포착 λŠ₯λ ₯을 크게 ν–₯μƒμ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
ν˜„μž¬ 지도 λ―Έμ„Έ μ‘°μ •λœ λͺ¨λΈλ“€μ€ μ—¬μ „νžˆ μƒλ‹Ήμˆ˜μ˜ ν•„μš”ν•œ λ°œμ–Έ μ‹œμ μ„ λ†“μΉ˜λŠ” κ²½ν–₯이 있으며, μ΄λŠ” λͺ¨λΈμ˜ κ³Όλ„ν•œ λ³΄μˆ˜μ„±μœΌλ‘œ μΈν•œ ν•œκ³„μž…λ‹ˆλ‹€.
πŸ‘