Sign In

Multi-Dimensional Behavioral Evaluation of Agentic Stock Prediction Systems Using Large Language Model Judges with Closed-Loop Reinforcement Learning Feedback

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Mohammad Al Ridhawi, Mahtab Haj Ali, Hussein Al Osman

πŸ’‘ κ°œμš”

κΈ°μ‘΄ 금육 예츑 ν‰κ°€λŠ” 결과의 μ •ν™•μ„±μ—λ§Œ μ§‘μ€‘ν–ˆμ§€λ§Œ, 졜근 μ—μ΄μ „νŠΈν™”λœ 예츑 μ‹œμŠ€ν…œμ€ λ³΅μž‘ν•œ μ˜μ‚¬κ²°μ • 과정을 κ±°μΉ˜λ―€λ‘œ 이에 λŒ€ν•œ 평가가 ν•„μš”ν•©λ‹ˆλ‹€. λ³Έ 논문은 λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM) μ‹¬νŒκ³Ό κ°•ν™”ν•™μŠ΅ ν”Όλ“œλ°±μ„ ν™œμš©ν•˜μ—¬ 예츑 κ³Όμ • 자체λ₯Ό λ‹€μ°¨μ›μ μœΌλ‘œ ν‰κ°€ν•˜λŠ” μƒˆλ‘œμš΄ 방법둠을 μ œμ•ˆν•©λ‹ˆλ‹€. μ œμ•ˆλœ 방법둠은 예츑 μ‹œμŠ€ν…œμ˜ 행동적 츑면을 ν‰κ°€ν•˜μ—¬ μ„±λŠ₯ ν–₯상에 기여함을 μž…μ¦ν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
LLM을 ν™œμš©ν•œ 예츑 μ‹œμŠ€ν…œμ˜ μ˜μ‚¬κ²°μ • 과정에 λŒ€ν•œ 닀차원적 행동 평가가 κ°€λŠ₯ν•΄μ‘ŒμŠ΅λ‹ˆλ‹€.
β€’
도메인 νŠΉν™”λœ 6κ°€μ§€ 차원(체제 감지, λΌμš°νŒ…, 적응, μœ„ν—˜ 보정, μ „λž΅ 일관성, 였λ₯˜ 볡ꡬ)μ—μ„œμ˜ 평가λ₯Ό 톡해 예츑 μ‹œμŠ€ν…œμ˜ 세뢀적인 강점과 약점을 νŒŒμ•…ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ 방법둠은 κ°•ν™”ν•™μŠ΅ 보상에 ν†΅ν•©λ˜μ–΄ 예츑 μ‹œμŠ€ν…œμ˜ μ„±λŠ₯을 효과적으둜 κ°œμ„ μ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
λ³Έ μ—°κ΅¬λŠ” μ˜€ν”„λΌμΈ λ°±ν…ŒμŠ€νŒ… ν™˜κ²½μ—μ„œ μˆ˜ν–‰λ˜μ—ˆμœΌλ―€λ‘œ, μ‹€μ œ 라이브 ν™˜κ²½μ—μ„œμ˜ 적용 μ‹œ λ°œμƒν•  수 μžˆλŠ” νš¨κ³Όμ— λŒ€ν•œ 좔가적인 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘