Sign In

OpAgent: Operator Agent for Web Navigation

Created by
  • Haebom
Category
Empty

μ €μž

Yuyu Guo, Wenjie Yang, Siyuan Yang, Ziyang Liu, Cheng Chen, Yuan Wei, Yun Hu, Yang Huang, Guoliang Hao, Dongsheng Yuan, Jianming Wang, Xin Chen, Hang Yu, Lei Lei, Peng Di

πŸ’‘ κ°œμš”

λ³Έ 논문은 λ³΅μž‘ν•˜κ³  동적인 μ‹€μ œ μ›Ή ν™˜κ²½μ—μ„œ μ‚¬μš©μžμ˜ λͺ…령을 μˆ˜ν–‰ν•˜λŠ” 자율 μ›Ή μ—μ΄μ „νŠΈμ˜ μ„±λŠ₯을 ν–₯μƒμ‹œν‚€κΈ° μœ„ν•œ OpAgentλ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. 기쑴의 μ˜€ν”„λΌμΈ ν•™μŠ΅ 방식이 κ°€μ§„ 뢄포 λ³€ν™” 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄, μ›Ήμ‚¬μ΄νŠΈμ™€μ˜ 직접적인 반볡 μƒν˜Έμž‘μš©μ„ 톡해 정책을 μ΅œμ ν™”ν•˜λŠ” 온라인 κ°•ν™”ν•™μŠ΅ 방식을 μ‚¬μš©ν•©λ‹ˆλ‹€. 이λ₯Ό 톡해 μ›Ή λ‚΄λΉ„κ²Œμ΄μ…˜ μž‘μ—…μ—μ„œ 71.6%의 SOTA 성곡λ₯ μ„ λ‹¬μ„±ν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
μ‹€μ œ μ›Ή ν™˜κ²½μ˜ λ³΅μž‘μ„±κ³Ό 동적인 νŠΉμ„±μ— 효과적으둜 λŒ€μ‘ν•  수 μžˆλŠ” 온라인 κ°•ν™”ν•™μŠ΅ 기반 μ›Ή μ—μ΄μ „νŠΈ μ„€κ³„μ˜ κ°€λŠ₯성을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
계측적 λ©€ν‹°νƒœμŠ€ν¬ λ―Έμ„Έ μ‘°μ •κ³Ό ν•˜μ΄λΈŒλ¦¬λ“œ 보상 λ©”μ»€λ‹ˆμ¦˜μ„ 톡해 κΈ΄ 호흑의 μ›Ή νƒμƒ‰μ—μ„œ λ°œμƒν•˜λŠ” μ‹ μš© ν• λ‹Ή 문제λ₯Ό μ™„ν™”ν•˜κ³  견고성을 λ†’μ˜€μŠ΅λ‹ˆλ‹€.
β€’
OpAgentλΌλŠ” λͺ¨λ“ˆμ‹ ν”„λ ˆμž„μ›Œν¬λ₯Ό 톡해 였λ₯˜ 볡ꡬ 및 자기 ꡐ정 λŠ₯λ ₯을 κ°•ν™”ν•˜μ—¬ SOTA μ„±λŠ₯을 λ‹¬μ„±ν–ˆμŠ΅λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ λ°©λ²•λ‘ μ˜ ν™•μž₯μ„±, λ‹€μ–‘ν•œ μ›Ήμ‚¬μ΄νŠΈ μœ ν˜•μ— λŒ€ν•œ μΌλ°˜ν™” μ„±λŠ₯, 그리고 μ‹€μ œ μ„œλΉ„μŠ€ ν™˜κ²½μ—μ„œμ˜ μ•ˆμ •μ„± 및 νš¨μœ¨μ„±μ— λŒ€ν•œ 좔가적인 검증이 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘