Sign In

When Agents Disagree With Themselves: Measuring Behavioral Consistency in LLM-Based Agents

Created by
  • Haebom
Category
Empty

μ €μž

Aman Mehta

πŸ’‘ κ°œμš”

λ³Έ μ—°κ΅¬λŠ” λ™μΌν•œ LLM 기반 μ—μ΄μ „νŠΈκ°€ λ™μΌν•œ νƒœμŠ€ν¬μ— λŒ€ν•΄ 싀행될 λ•Œ 행동 일관성이 λΆ€μ‘±ν•˜λ‹€λŠ” 점을 λ°œκ²¬ν–ˆμŠ΅λ‹ˆλ‹€. Llama 3.1 70B, GPT-4o, Claude Sonnet 4.5 λͺ¨λΈμ„ μ‚¬μš©ν•˜μ—¬ HotpotQA νƒœμŠ€ν¬μ—μ„œ 3,000번의 싀행을 λΆ„μ„ν•œ κ²°κ³Ό, ReAct μŠ€νƒ€μΌ μ—μ΄μ „νŠΈκ°€ ν‰κ· μ μœΌλ‘œ 10번 μ‹€ν–‰ μ‹œ 2.0~4.2개의 μ„œλ‘œ λ‹€λ₯Έ 행동 μ‹œν€€μŠ€λ₯Ό μƒμ„±ν•˜λŠ” κ²ƒμœΌλ‘œ λ‚˜νƒ€λ‚¬μŠ΅λ‹ˆλ‹€. μ΄λŸ¬ν•œ 행동 λΆˆμΌμΉ˜λŠ” νƒœμŠ€ν¬ μ‹€νŒ¨μ™€ 높은 상관관계λ₯Ό 보이며, 초기 κ²°μ • 단계(첫 번째 검색 쿼리)μ—μ„œ 주둜 λ°œμƒν•¨μ„ ν™•μΈν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
LLM 기반 μ—μ΄μ „νŠΈμ˜ 행동 λΆˆμΌμΉ˜λŠ” 예츑 κ°€λŠ₯ν•œ ν˜„μƒμ΄λ©°, νƒœμŠ€ν¬ 성곡λ₯ μ— 직접적인 영ν–₯을 λ―ΈμΉ©λ‹ˆλ‹€.
β€’
μ‹€ν–‰ 쀑 행동 일관성을 λͺ¨λ‹ˆν„°λ§ν•˜λŠ” 것이 μ—μ΄μ „νŠΈμ˜ 였λ₯˜λ₯Ό 쑰기에 κ°μ§€ν•˜κ³  신뒰성을 λ†’μ΄λŠ” 효과적인 방법이 될 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
λ³Έ μ—°κ΅¬λŠ” ReAct μŠ€νƒ€μΌ μ—μ΄μ „νŠΈμ™€ HotpotQA νƒœμŠ€ν¬μ— κ΅­ν•œλœ 결과이며, λ‹€λ₯Έ μ—μ΄μ „νŠΈ μ•„ν‚€ν…μ²˜λ‚˜ νƒœμŠ€ν¬μ— λŒ€ν•œ μΌλ°˜ν™” κ°€λŠ₯성은 좔가적인 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
β€’
μ—μ΄μ „νŠΈμ˜ 행동 뢈일치λ₯Ό 쀄이기 μœ„ν•œ ꡬ체적인 방법둠 개발이 ν–₯ν›„ 과제둜 λ‚¨μ•„μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘