Sign In

From Passive Reuse to Active Reasoning: Grounding Large Language Models for Neuro-Symbolic Experience Replay

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Yanan Xiao, Yixiang Tang, Zechen Feng, Lu Jiang, Minghao Yin, Pengyang Wang

πŸ’‘ κ°œμš”

λ³Έ 논문은 κ°•ν™”ν•™μŠ΅μ—μ„œ κ²½ν—˜ μž¬ν˜„(experience replay)이 μƒ˜ν”Œμ˜ 의미둠적 μ€‘μš”λ„ λŒ€μ‹  수치적 였λ₯˜μ— κΈ°λ°˜ν•˜μ—¬ μˆ˜λ™μ μœΌλ‘œ μž‘λ™ν•˜λŠ” 문제λ₯Ό μ§€μ ν•©λ‹ˆλ‹€. 이λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄, λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)을 ν™œμš©ν•˜μ—¬ 행동 κ·œμΉ™μ„ μΆ”μΆœν•˜κ³  이λ₯Ό μ‹ κ²½-기호 논리 ν˜•νƒœλ‘œ λ³€ν™˜ν•˜μ—¬ κ²½ν—˜ μž¬ν˜„ 뢄포λ₯Ό λ™μ μœΌλ‘œ μž¬μ‘°μ •ν•˜λŠ” μ‹ κ²½-기호 κ²½ν—˜ μž¬ν˜„(NSER) ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. NSERλŠ” 좔상적 지식이 μ •μ±… μ΅œμ ν™”μ— 직접 영ν–₯을 λ―ΈμΉ˜λ„λ‘ ν•¨μœΌλ‘œμ¨ μƒ˜ν”Œ νš¨μœ¨μ„±κ³Ό 수렴 속도λ₯Ό κ°œμ„ ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
κ°•ν™”ν•™μŠ΅μ—μ„œ LLM을 ν™œμš©ν•˜μ—¬ κ²½ν—˜ μž¬ν˜„μ„ λŠ₯동적인 지식 ꡬ성 λ©”μ»€λ‹ˆμ¦˜μœΌλ‘œ μ „ν™˜ν•¨μœΌλ‘œμ¨ 데이터 νš¨μœ¨μ„±μ„ 높일 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
μ–Έμ–΄ λͺ¨λΈ 기반의 좔상적 κ·œμΉ™ ν•™μŠ΅κ³Ό 신경망 기반의 수치 μ΅œμ ν™” κ°„μ˜ 간극을 μ‹ κ²½-기호적 νŒŒμ΄ν”„λΌμΈμ„ 톡해 효과적으둜 ν•΄μ†Œν•©λ‹ˆλ‹€.
β€’
λ‹€μ–‘ν•œ μœ ν˜•μ˜ κ°•ν™”ν•™μŠ΅ λ²€μΉ˜λ§ˆν¬μ—μ„œ κΈ°μ‘΄ 방식 λŒ€λΉ„ λ›°μ–΄λ‚œ μ„±λŠ₯ ν–₯상을 λ³΄μž…λ‹ˆλ‹€.
β€’
LLM의 μ œλ‘œμƒ· λŠ₯λ ₯을 ν™œμš©ν•˜λ―€λ‘œ, νŠΉμ • 도메인에 λŒ€ν•œ 사전 ν•™μŠ΅ 없이도 적용 κ°€λŠ₯성이 λ†’μŠ΅λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ μ‹ κ²½-기호 논리 ν‘œν˜„μ˜ λ³΅μž‘μ„± 및 LLM μΆ”λ‘ μ˜ λΉ„μš©κ³Ό νš¨μœ¨μ„±μ— λŒ€ν•œ 좔가적인 연ꡬ가 ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘