Sign In

Progressive Autonomy as Preference Learning: A Formalization of Trust Calibration for Agentic Tool Use

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Changkun Ou

πŸ’‘ κ°œμš”

λ³Έ μ—°κ΅¬λŠ” μžλ™ν™”λœ μ—μ΄μ „νŠΈμ˜ 도ꡬ μ‚¬μš© μ‹œ μΈκ°„μ˜ μŠΉμΈμ„ 받을지 λ˜λŠ” 자율적으둜 싀행될지 κ²°μ •ν•˜λŠ” 'μ‹ λ’° 보정(trust calibration)' 문제λ₯Ό μ„ ν˜Έλ„ ν•™μŠ΅(preference learning) 문제둜 κ³΅μ‹ν™”ν•©λ‹ˆλ‹€. Gaussian processλ₯Ό ν™œμš©ν•˜μ—¬ μΈκ°„μ˜ 잠재적인 μœ„ν—˜ 감수 ν•¨μˆ˜μ— λŒ€ν•œ 사후 뢄포λ₯Ό μœ μ§€ν•˜κ³ , 승인/κ±°λΆ€ ν”Όλ“œλ°±μ„ 톡해 이 ν•¨μˆ˜λ₯Ό κ΄€μ°°ν•˜λ©°, κ°€μž₯ λΆˆν™•μ‹€ν•œ μ§€μ μ—μ„œ μΈκ°„μ—κ²Œ μ—μŠ€μ»¬λ ˆμ΄μ…˜ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
μΈκ°„μ˜ μœ„ν—˜ 감수 μˆ˜μ€€μ„ λ™μ μœΌλ‘œ ν•™μŠ΅ν•˜μ—¬ μ—μ΄μ „νŠΈμ˜ 자율 μ‹€ν–‰ λ²”μœ„λ₯Ό μ‹ λ’° 기반으둜 μ‘°μ •ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
λΆˆν™•μ‹€μ„±μ΄ 높은 상황에 μ§‘μ€‘μ μœΌλ‘œ μΈκ°„μ˜ ν”Όλ“œλ°±μ„ μš”μ²­ν•¨μœΌλ‘œμ¨ 효율적인 μ‹ λ’° 보정이 κ°€λŠ₯ν•©λ‹ˆλ‹€.
β€’
λ³Έ μ—°κ΅¬λŠ” 'ν—ˆμš©/차단/질문' μ˜μ—­μœΌλ‘œ 행동 곡간을 λΆ„λ₯˜ν•˜λŠ” 것을 λͺ©ν‘œλ‘œ ν•˜λ©°, μ΄λŠ” 기쑴의 섀계 μ΅œμ ν™”μ™€λŠ” λ‹€λ₯Έ λͺ©μ μ„ κ°€μ§‘λ‹ˆλ‹€.
β€’
Gaussian process 기반의 근사적 λΆ„λ₯˜ 방법둠과 μƒ˜ν”Œ νš¨μœ¨μ„± μ£Όμž₯이 적용 κ°€λŠ₯ν•˜μ§€λ§Œ, λ³Έ μ—°κ΅¬μ˜ μ‹€μ œμ μΈ λͺ©ν‘œ 달성을 μœ„ν•œ 좔가적인 검증이 ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘