haebom
Sign In
BAMI: Training-Free Bias Mitigation in GUI Grounding
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Borui Zhang, Bo Zhang, Bo Wang, Wenzhao Zheng, Yuhao Cheng, Liang Tang, Yiqiang Yan, Jie Zhou, Jiwen Lu
π‘ κ°μ
λ³Έ λ Όλ¬Έμ GUI κΈ°λ° μμ μνμ νμμ μΈ GUI grounding μ±λ₯μ μ ν΄νλ μ£Όμ μμΈμΌλ‘ λμ μ΄λ―Έμ§ ν΄μλμ 볡μ‘ν μΈν°νμ΄μ€ μμλ₯Ό μ§λͺ©ν©λλ€. μ΄λ₯Ό ν΄κ²°νκΈ° μν΄, μ μνλ Bias-Aware Manipulation Inference (BAMI) κΈ°λ²μ νλ ¨ μμ΄λ coarse-to-fine μ§μ€ λ° ν보 μ ν λ±μ μ‘°μμ ν΅ν΄ μ΄λ¬ν νΈν₯μ ν¨κ³Όμ μΌλ‘ μνν©λλ€. μ€ν κ²°κ³Ό, BAMIλ λ€μν GUI grounding λͺ¨λΈμ μ νλλ₯Ό μλΉ λΆλΆ ν₯μμμΌ°μΌλ©°, νΉν TianXi-Action-7B λͺ¨λΈμ ScreenSpot-Pro λ²€μΉλ§ν¬ μ νλλ₯Ό 51.9%μμ 57.8%λ‘ λμ΄μ¬λ Έμ΅λλ€.
π μμ¬μ λ° νκ³
β’
νλ ¨ μμ΄λ GUI grounding λͺ¨λΈμ μ νλλ₯Ό ν₯μμν€λ ν¨κ³Όμ μΈ λ°©λ²λ‘ μ μ μνμ΅λλ€.
β’
μ΄λ―Έμ§ ν΄μλμ μΈν°νμ΄μ€ 볡μ‘μ±μΌλ‘ μΈν νΈν₯μ λͺ νν κ·λͺ νκ³ ν΄κ²°μ± μ μ μν©λλ€.
β’
λ€μν λͺ¨λΈ λ° νλΌλ―Έν° μ€μ μμ BAMIμ μμ μ±κ³Ό ν¨κ³Όμ±μ μ μ¦νμ΅λλ€.
β’
μ μλ νΈν₯ μν κΈ°λ²μ΄ μ€μ 볡μ‘ν GUI νκ²½μμ μΌλ§λ λ κ΄λ²μνκ² μ μ©λ μ μλμ§μ λν μΆκ°μ μΈ μ°κ΅¬κ° νμν©λλ€.
PDF 보기
Made with Slashpage