haebom
Sign In
ProRe: A Proactive Reward System for GUI Agents via Reasoner-Actor Collaboration
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Gaole Dai, Shiqi Jiang, Ting Cao, Yuqing Yang, Yuanchun Li, Rui Tan, Mo Li, Lili Qiu
π‘ κ°μ
λ³Έ λ Όλ¬Έμ GUI μμ΄μ νΈ νλ ¨μ μμ΄ κΈ°μ‘΄ 보μ μμ€ν μ νκ³λ₯Ό 극볡νκΈ° μν΄ μ΄μ κΈ°-νμμ νμ κΈ°λ°μ μ μ μ 보μ μμ€ν μΈ ProReλ₯Ό μ μν©λλ€. ProReλ μ΄μ κΈ°κ° λͺ©ν μν νμ μμ μ κ³ννκ³ , νμμκ° νκ²½κ³Ό μνΈμμ©νμ¬ κ΄μ°° λ°μ΄ν°λ₯Ό μμ§ν¨μΌλ‘μ¨ μ ννκ³ κ²μ¦ κ°λ₯ν 보μμ μμ±ν©λλ€. μ΄λ₯Ό ν΅ν΄ GUI μμ΄μ νΈμ μ±λ₯μ ν¬κ² ν₯μμν¬ μ μμ΅λλ€.
π μμ¬μ λ° νκ³
β’
GUI νκ²½μμ 보μ μμ€ν μ μΌλ°ν κ°λ₯μ± λ° μ νλ ν₯μ.
β’
μ΄μ κΈ°μ νμμ κ°μ νμ μ ν΅ν λμ μ΄κ³ λ₯λμ μΈ λ°μ΄ν° μμ§ λ° λ³΄μ μμ± λ°©μ μ μ.
β’
μ€μ νκ²½μμ 3μ² κ° μ΄μμ κΆ€μ λ°μ΄ν°μ μ ν΅ν΄ ProReμ μ ν¨μ± λ° μ±λ₯ κ°μ μ μ¦.
β’
ν₯ν μ°κ΅¬μμλ λ 볡μ‘νκ³ λμ μΈ GUI νκ²½μ λν μ μ© κ°λ₯μ± λ° νμ₯μ±μ νꡬν΄μΌ ν κ²μ λλ€.
PDF 보기
Made with Slashpage