Sign In

Vocabulary Dropout for Curriculum Diversity in LLM Co-Evolution

Created by
  • Haebom
Category
Empty

μ €μž

Jacob Dineen, Aswin RRV, Zhikun Xu, Ben Zhou

πŸ’‘ κ°œμš”

λ³Έ 논문은 자율적인 컀리큘럼 ν•™μŠ΅μ„ λͺ©ν‘œλ‘œ ν•˜λŠ” μ–Έμ–΄ λͺ¨λΈ(LLM) 곡동 μ§„ν™”μ—μ„œ λ°œμƒν•˜λŠ” 문제점, 즉 생성 λͺ¨λΈ(proposer)이 쒁은 문제 λΆ„ν¬λ‘œ μˆ˜λ ΄ν•˜μ—¬ ν•™μŠ΅ 닀양성이 λ¬΄λ„ˆμ§€λŠ” ν˜„μƒμ„ ν•΄κ²°ν•˜κ³ μž ν•©λ‹ˆλ‹€. 이λ₯Ό μœ„ν•΄ μ œμ•ˆλœ "μ–΄νœ˜ λ“œλ‘­μ•„μ›ƒ(vocabulary dropout)" 기법은 생성 λͺ¨λΈμ˜ 좜λ ₯ λ‘œμ§“μ— λ¬΄μž‘μœ„ 마슀크λ₯Ό μ μš©ν•˜μ—¬ 토큰 μ‹œν€€μŠ€κ°€ κ³ μ •λ˜λŠ” 것을 λ°©μ§€ν•˜κ³  ν•™μŠ΅ 닀양성을 μœ μ§€ν•©λ‹ˆλ‹€. μ‹€ν—˜ κ²°κ³Ό, 이 기법은 μ–΄νœ˜, 의미, κΈ°λŠ₯적 μ§€ν‘œ μ „λ°˜μ— 걸쳐 생성 λͺ¨λΈμ˜ 닀양성을 μœ μ§€ν•˜κ³ , 특히 μˆ˜ν•™μ  μΆ”λ‘  λŠ₯λ ₯μ—μ„œ 솔버(solver) μ„±λŠ₯을 μœ μ˜λ―Έν•˜κ²Œ ν–₯μƒμ‹œν‚€λŠ” κ²ƒμœΌλ‘œ λ‚˜νƒ€λ‚¬μŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
생성 λͺ¨λΈμ˜ λ‹€μ–‘μ„± μœ μ§€: μ–΄νœ˜ λ“œλ‘­μ•„μ›ƒμ€ LLM 곡동 μ§„ν™” κ³Όμ •μ—μ„œ 생성 λͺ¨λΈμ˜ 문제 생성 닀양성을 효과적으둜 μœ μ§€ν•˜μ—¬ ν•™μŠ΅ μ»€λ¦¬ν˜λŸΌμ„ λ”μš± ν’λΆ€ν•˜κ²Œ λ§Œλ“­λ‹ˆλ‹€.
β€’
ν•™μŠ΅ μ„±λŠ₯ ν–₯상: 닀양성이 μœ μ§€λœ μ»€λ¦¬ν˜λŸΌμ€ 문제 ν•΄κ²° λͺ¨λΈμ˜ μ„±λŠ₯을 μ „λ°˜μ μœΌλ‘œ ν–₯μƒμ‹œν‚€λ©°, 특히 높은 μˆ˜μ€€μ˜ λ²€μΉ˜λ§ˆν¬μ—μ„œ λ”μš± λ‘λ“œλŸ¬μ§„ κ°œμ„ μ„ λ³΄μž…λ‹ˆλ‹€.
β€’
ν•œκ³„μ  및 ν–₯ν›„ 과제: μ œμ•ˆλœ μ–΄νœ˜ λ“œλ‘­μ•„μ›ƒμ€ 비ꡐ적 κ°„λ‹¨ν•œ κΈ°λ²•μ΄μ§€λ§Œ, 곡동 μ§„ν™” κ³Όμ •μ—μ„œ 생산적인 ν˜‘λ ₯을 μœ μ§€ν•˜κΈ° μœ„ν•œ λͺ…μ‹œμ μΈ 행동 곡간 μ œμ•½μ˜ μ€‘μš”μ„±μ„ μ‹œμ‚¬ν•©λ‹ˆλ‹€. ν–₯ν›„μ—λŠ” 이 원리λ₯Ό λ”μš± λ°œμ „μ‹œν‚€κ±°λ‚˜ λ‹€λ₯Έ ν˜•νƒœμ˜ μ œμ•½μ„ νƒκ΅¬ν•˜λŠ” 연ꡬ가 ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘