Sign In

Honest Lying: Understanding Memory Confabulation in Reflexive Agents

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Prakhar Dixit, Sadia Kamal, Tim Oates

πŸ’‘ κ°œμš”

λ³Έ 논문은 κΈ°μ–΅ 보정(memory confabulation)μ΄λΌλŠ” μƒˆλ‘œμš΄ μ‹€νŒ¨ λͺ¨λ“œλ₯Ό νƒκ΅¬ν•˜λ©°, Reflexion μŠ€νƒ€μΌμ˜ μ—μ΄μ „νŠΈκ°€ μžμ‹ μ˜ μ‹€νŒ¨λ₯Ό μ •ν™•νžˆ μ§„λ‹¨ν•œλ‹€λŠ” 암묡적 가정이 잘λͺ»λ˜μ—ˆμŒμ„ λ³΄μ—¬μ€λ‹ˆλ‹€. μ—μ΄μ „νŠΈλŠ” μžμ‹ κ° μžˆμ§€λ§Œ ν‹€λ¦° 과제 해석을 κΈ°μ–΅μœΌλ‘œ μ €μž₯ν•˜κ³ , ν™˜κ²½μ΄ μ΄ˆκΈ°ν™”λ˜μ–΄λ„ 계속 잘λͺ»λœ 행동을 λ°˜λ³΅ν•©λ‹ˆλ‹€. 이λ₯Ό λΆ„μ„ν•˜κΈ° μœ„ν•΄ λ°˜μ‚¬ 반볡λ₯ (Reflection Repetition Rate, RRR)μ΄λΌλŠ” μƒˆλ‘œμš΄ 둜그 기반 μ§€ν‘œλ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
λ°˜μ‚¬μ  κΈ°μ–΅μ˜ ν•œκ³„: Reflexion μŠ€νƒ€μΌ μ—μ΄μ „νŠΈμ˜ 자기 λ°˜μ„±μ  기얡이 였히렀 잘λͺ»λœ λ―ΏμŒμ„ κ°•ν™”ν•˜μ—¬ 였λ₯˜ μˆ˜μ • λŠ₯λ ₯을 μ €ν•΄ν•  수 μžˆμŒμ„ μ‹œμ‚¬ν•©λ‹ˆλ‹€.
β€’
μƒˆλ‘œμš΄ 였λ₯˜ 탐지 μ§€ν‘œ: Reflection Repetition Rate (RRR)은 μ—μ΄μ „νŠΈμ˜ κΈ°μ–΅ 보정 μ‹€νŒ¨λ₯Ό μ •λŸ‰μ μœΌλ‘œ νƒμ§€ν•˜λŠ” μœ μš©ν•œ 도ꡬλ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€.
β€’
ν•΄κ²° λ°©μ•ˆμ˜ κ°€λŠ₯μ„±: κ°œλ°©ν˜• 자기 진단 λŒ€μ‹  ꢀ적 μˆ˜μ€€μ˜ μ‹€νŒ¨ μ‹ ν˜Έλ₯Ό ν”„λ‘œκ·Έλž˜λ° λ°©μ‹μœΌλ‘œ μΆ”μΆœν•˜λŠ” μ™„ν™” μ „λž΅μ΄ μ—μ΄μ „νŠΈμ˜ μ„±λŠ₯을 크게 ν–₯μƒμ‹œν‚¬ 수 μžˆμŒμ„ λ³΄μ—¬μ£Όμ—ˆμŠ΅λ‹ˆλ‹€.
β€’
μ œν•œλœ ν™˜κ²½: λ³Έ μ—°κ΅¬μ—μ„œ μ œμ‹œλœ ALFWorld와 HumanEval ν™˜κ²½ μ™Έμ˜ λ‹€μ–‘ν•œ ν™˜κ²½ 및 λ³΅μž‘ν•œ μž‘μ—…μ— λŒ€ν•œ μ—μ΄μ „νŠΈμ˜ κΈ°μ–΅ 보정 λ¬Έμ œμ™€ μ™„ν™” μ „λž΅μ˜ νš¨κ³ΌλŠ” 좔가적인 검증이 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘