Sign In

ConvoLearn: A Learning Sciences Grounded Dataset for Fine-Tuning Dialogic AI Tutors

Created by
  • Haebom
Category
Empty

μ €μž

Mayank Sharma, Roy Pea, Hari Subramonyam

πŸ’‘ κ°œμš”

λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM) 기반 AI νŠœν„°λŠ” ꡐ윑 λΆ„μ•Όμ—μ„œ 널리 μ‚¬μš©λ˜κ³  μžˆμ§€λ§Œ, 효과적인 νŠœν„°λ§μ˜ 핡심 원칙인 λŒ€ν™”μ  지식 κ΅¬μ„±μ—λŠ” μ—¬μ „νžˆ λΆ€ν•©ν•˜μ§€ λͺ»ν•˜λŠ” λ¬Έμ œκ°€ μžˆμŠ΅λ‹ˆλ‹€. λ³Έ μ—°κ΅¬λŠ” 지식 ꡬ좕 이둠에 κΈ°λ°˜ν•œ 6κ°€μ§€ μ°¨μ›μ˜ λŒ€ν™”μ  νŠœν„°λ§μ„ κ΅¬ν˜„ν•œ 2,134개의 μ€€ν•©μ„± νŠœν„°-학생 λŒ€ν™” 데이터셋인 ConvoLearn을 μ†Œκ°œν•©λ‹ˆλ‹€. ConvoLearn을 ν™œμš©ν•œ ν›ˆλ ¨ 데이터가 μ‹€μ œ κ΅μ‹€μ—μ„œμ˜ ꡐ윑적 ν’ˆμ§ˆκ³Ό μœ μ˜λ―Έν•œ 상관관계λ₯Ό 보이며, Mistral-7B λͺ¨λΈμ„ νŠœλ‹ν•œ κ²°κ³Ό λŒ€ν™”μ  νŠœν„°λ§ ν–‰λ™μ—μ„œ 유λŠ₯ν•œ κ΅μ‚¬λ“€λ‘œλΆ€ν„° 경쟁λ ₯ μžˆλŠ” 평가λ₯Ό λ°›μ•˜μŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
λŒ€ν™”μ  νŠœν„°λ§μ˜ 핡심 원칙을 λͺ…ν™•νžˆ μ •μ˜ν•˜κ³  이λ₯Ό λ°μ΄ν„°μ…‹μœΌλ‘œ κ΅¬ν˜„ν•˜μ—¬ LLM 기반 AI νŠœν„°μ˜ ꡐ윑적 νš¨κ³Όμ„±μ„ ν–₯μƒμ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
μ€€ν•©μ„± 데이터셋 ν•™μŠ΅λ§ŒμœΌλ‘œλ„ μ‹€μ œ ꡐ윑 ν˜„μž₯μ—μ„œμ˜ ꡐ윑적 ν’ˆμ§ˆμ„ μ˜ˆμΈ‘ν•˜λŠ” 것이 κ°€λŠ₯ν•˜λ©°, μ΄λŠ” AI νŠœν„° κ°œλ°œμ— μ€‘μš”ν•œ 기반이 λ©λ‹ˆλ‹€.
β€’
λ³Έ μ—°κ΅¬λŠ” 7B 크기의 μ˜€ν”ˆ κ°€μ€‘μΉ˜ λͺ¨λΈμ„ λŒ€ν™”μ  νŠœν„°λ§μœΌλ‘œ νŠœλ‹ν•  수 μžˆμŒμ„ λ³΄μ—¬μ£Όμ—ˆμœΌλ©°, μ΄λŠ” 더 λ§Žμ€ μ—°κ΅¬μžλ“€μ΄ 이λ₯Ό ν™œμš©ν•  수 μžˆλŠ” κ°€λŠ₯성을 μ—΄μ–΄μ€λ‹ˆλ‹€.
β€’
데이터셋이 쀑학ꡐ 지ꡬ과학 μ»€λ¦¬ν˜λŸΌμ— κ΅­ν•œλ˜μ–΄ μžˆλ‹€λŠ” 점은 ν–₯ν›„ λ‹€λ₯Έ κ³Όλͺ© 및 μ—°λ ΉλŒ€μ— λŒ€ν•œ ν™•μž₯ μ—°κ΅¬μ˜ ν•„μš”μ„±μ„ μ‹œμ‚¬ν•©λ‹ˆλ‹€.
πŸ‘