Sign In

HiPRAG: Hierarchical Process Rewards for Efficient Agentic Retrieval Augmented Generation

Created by
  • Haebom
Category
Empty

μ €μž

Peilin Wu, Mian Zhang, Kun Wan, Wentian Zhao, Kaiyu He, Xinya Du, Zhiyu Chen

πŸ’‘ κ°œμš”

λ³Έ μ—°κ΅¬λŠ” 검색 증강 생성(RAG) μ—μ΄μ „νŠΈμ˜ λΉ„νš¨μœ¨μ μΈ 검색 행동(κ³Όλ‹€ 검색 및 κ³Όμ†Œ 검색)을 κ°œμ„ ν•˜κΈ° μœ„ν•΄ 계측적 ν”„λ‘œμ„ΈμŠ€ 보상(HiPRAG)을 μ œμ•ˆν•©λ‹ˆλ‹€. HiPRAGλŠ” μ—μ΄μ „νŠΈμ˜ μΆ”λ‘  과정을 κ°œλ³„ λ‹¨κ³„λ‘œ λΆ„ν•΄ν•˜κ³ , 각 검색 κ²°μ •μ˜ ν•„μš”μ„±μ„ μ‹€μ‹œκ°„μœΌλ‘œ ν‰κ°€ν•˜μ—¬ 졜적의 검색 및 비검색 단계 λΉ„μœ¨μ— 따라 μΆ”κ°€ λ³΄λ„ˆμŠ€λ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€. 이λ₯Ό 톡해 μ΅œμ’… 결과뿐만 μ•„λ‹ˆλΌ μΆ”λ‘  κ³Όμ • 자체λ₯Ό μ΅œμ ν™”ν•˜μ—¬ 검색 νš¨μœ¨μ„±κ³Ό 정확도λ₯Ό λ†’μ΄λŠ” 것을 λͺ©ν‘œλ‘œ ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
검색 증강 생성(RAG) μ—μ΄μ „νŠΈμ˜ νš¨μœ¨μ„± ν–₯상: HiPRAGλŠ” κ³Όλ‹€ 검색 및 κ³Όμ†Œ 검색 문제λ₯Ό 효과적으둜 μ™„ν™”ν•˜μ—¬ RAG μ—μ΄μ „νŠΈμ˜ 검색 νš¨μœ¨μ„±μ„ 크게 ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€.
β€’
μΆ”λ‘  κ³Όμ • μ΅œμ ν™”μ˜ μ€‘μš”μ„± μž…μ¦: μ΅œμ’… 결과뿐만 μ•„λ‹ˆλΌ μ—μ΄μ „νŠΈμ˜ μΆ”λ‘  κ³Όμ • 자체λ₯Ό μ„Έλ°€ν•˜κ²Œ μ œμ–΄ν•˜κ³  λ³΄μƒν•¨μœΌλ‘œμ¨ 문제 ν•΄κ²° λŠ₯λ ₯을 λ”μš± ν–₯μƒμ‹œν‚¬ 수 μžˆμŒμ„ λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
λ‹€μ–‘ν•œ λͺ¨λΈ 및 μ•Œκ³ λ¦¬μ¦˜μ— λŒ€ν•œ μΌλ°˜ν™” κ°€λŠ₯μ„±: HiPRAGλŠ” λ‹€μ–‘ν•œ RL μ•Œκ³ λ¦¬μ¦˜, λͺ¨λΈ νŒ¨λ°€λ¦¬, 크기 및 μœ ν˜•μ— 걸쳐 μš°μˆ˜ν•œ μΌλ°˜ν™” μ„±λŠ₯을 보여 RAG μ—μ΄μ „νŠΈ κ°œμ„ μ— ν­λ„“κ²Œ 적용될 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
μ •ν™•ν•œ ν”„λ‘œμ„ΈμŠ€ 평가λ₯Ό μœ„ν•œ 섀계 λ³΅μž‘μ„±: μ—μ΄μ „νŠΈμ˜ μΆ”λ‘  과정을 μ„Έλ°€ν•˜κ²Œ λΆ„ν•΄ν•˜κ³  각 λ‹¨κ³„μ˜ ν•„μš”μ„±μ„ μ •ν™•ν•˜κ²Œ ν‰κ°€ν•˜λŠ” 것은 섀계 및 κ΅¬ν˜„μ— μžˆμ–΄ λ³΅μž‘μ„±μ„ μ•ΌκΈ°ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘