Sign In

LiteResearcher: A Scalable Agentic RL Training Framework for Deep Research Agent

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Wanli Li, Bince Qu, Bo Pan, Jianyu Zhang, Zheng Liu, Pan Zhang, Wei Chen, Bo Zhang

πŸ’‘ κ°œμš”

λ³Έ 논문은 μ‹€μ œ 검색 λŠ₯λ ₯ 강화에 ν•œκ³„κ°€ μžˆλŠ” κΈ°μ‘΄ κ°•ν™”ν•™μŠ΅(RL) 기반 챗봇 연ꡬ λ°©λ²•λ‘ μ˜ λ¬Έμ œμ μ„ μ§€μ ν•©λ‹ˆλ‹€. μ‹€μ œ 검색 μ˜μ‘΄μ„±μœΌλ‘œ μΈν•œ λΆˆμ•ˆμ •μ„±κ³Ό 높은 λΉ„μš© 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄, μ‹€μ œ 검색 ν™˜κ²½μ„ λͺ¨λ°©ν•œ κ²½λŸ‰ 가상 세계λ₯Ό κ΅¬μΆ•ν•˜λŠ” 'LiteResearcher' ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. 이 ν”„λ ˆμž„μ›Œν¬λŠ” μ§€μ†μ μœΌλ‘œ κ°œμ„ λ˜λŠ” ν•™μŠ΅ 방식을 톡해 μž‘μ€ 규λͺ¨μ˜ 검색 μ—μ΄μ „νŠΈκ°€ λŒ€κ·œλͺ¨ μƒμš© λͺ¨λΈλ³΄λ‹€ λ›°μ–΄λ‚œ μ„±λŠ₯을 보이도둝 ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
ν™•μž₯ κ°€λŠ₯ν•œ Agentic RL ν›ˆλ ¨μ˜ μ€‘μš”μ„±: λ³Έ μ—°κ΅¬λŠ” μ‹€μ œ λ°μ΄ν„°μ˜ μ œμ•½κ³Ό λΉ„μš© 문제λ₯Ό κ·Ήλ³΅ν•˜λŠ” 효율적인 ν›ˆλ ¨ ν”„λ ˆμž„μ›Œν¬λ₯Ό 톡해 Agentic RL의 ν™•μž₯성을 확보할 수 μžˆμŒμ„ λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
μž‘μ€ μ—μ΄μ „νŠΈμ˜ κ°•λ ₯ν•œ μ„±λŠ₯: κ²½λŸ‰ 가상 μ„Έκ³„μ—μ„œμ˜ ν›ˆλ ¨λ§ŒμœΌλ‘œλ„ κΈ°μ‘΄ λŒ€κ·œλͺ¨ λͺ¨λΈμ„ λŠ₯κ°€ν•˜λŠ” 연ꡬ λŠ₯λ ₯을 κ°–μΆ˜ μ—μ΄μ „νŠΈ 개발이 κ°€λŠ₯함을 μž…μ¦ν–ˆμŠ΅λ‹ˆλ‹€.
β€’
가상 세계와 μ‹€μ œ 세계 κ°„μ˜ κ°„κ·Ή: LiteResearcherκ°€ μ œμ•ˆν•˜λŠ” κ²½λŸ‰ 가상 세계가 μ‹€μ œ 검색 ν™˜κ²½μ˜ λ³΅μž‘μ„±κ³Ό λ―Έλ¬˜ν•œ 차이λ₯Ό μ–Όλ§ˆλ‚˜ μ™„λ²½ν•˜κ²Œ λ°˜μ˜ν•  수 μžˆλŠ”μ§€μ— λŒ€ν•œ 좔가적인 검증이 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘