haebom
Sign In
Bi-Level Prompt Optimization for Multimodal LLM-as-a-Judge
Created by
Haebom
Category
Empty
μ μ
Bo Pan, Xuan Kan, Kaitai Zhang, Yan Yan, Shunwen Tan, Zihao He, Zixin Ding, Junjie Wu, Liang Zhao
π‘ κ°μ
μ΄ λ Όλ¬Έμ λ©ν°λͺ¨λ¬ LLMμ μ΄λ―Έμ§ νκ°μ μλ νμ¬λ‘ νμ©ν λ λ°μνλ μΈκ° νλ¨κ³Όμ μ λ ¬ λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν ν둬ννΈ μ΅μ ν λ°©λ²μ μ μν©λλ€. μ νλ 컨ν μ€νΈ μ°½μΌλ‘ μΈν΄ λ©ν°λͺ¨λ¬ λͺ¨λΈμ΄ λ§μ μκ°μ μμ λ₯Ό μ²λ¦¬νκΈ° μ΄λ ΅λ€λ λ³λͺ© νμμ 극볡νκΈ° μν΄, μ΄λ―Έμ§μ ν΅μ¬ μκ° μ 보λ₯Ό ν μ€νΈλ‘ λ³ννλ λμμ νκ° κ΄λ ¨ λ¨μλ₯Ό μ μ§νλ Bi-Level Prompt Optimization (BLPO) νλ μμν¬λ₯Ό κ°λ°νμ΅λλ€. BLPOλ νμ¬ ν둬ννΈμ μ΄λ―Έμ§-ν μ€νΈ λ³ν ν둬ννΈλ₯Ό 곡λμΌλ‘ μ΅μ ννμ¬ μ νλ 컨ν μ€νΈ μμ° λ΄μμ νκ° μΆ©μ€λλ₯Ό μ μ§ν©λλ€.
π μμ¬μ λ° νκ³
β’
λ©ν°λͺ¨λ¬ LLMμ μλ νμ¬λ‘ μ¬μ©ν λ λ°μνλ 컨ν μ€νΈ μ°½ μ μ½ λ¬Έμ λ₯Ό 극볡νκ³ , νκ° κ΄λ ¨ μκ° μ 보λ₯Ό ν¨κ³Όμ μΌλ‘ ν μ€νΈλ‘ λ³ννλ μλ‘μ΄ μ κ·Ό λ°©μμ μ μνμ΅λλ€.
β’
μ΄λ―Έμ§-ν μ€νΈ λ³νκ³Ό νμ¬ ν둬ννΈ μ΅μ νλ₯Ό λμμ μ§ννλ νλ μμν¬λ₯Ό ν΅ν΄ μ νλ μμ νμμ λμ νκ° μ±λ₯μ λ¬μ±ν μ μμμ μ μ¦νμ΅λλ€.
β’
μ μλ λ°©λ²λ‘ μ ν¨κ³Όμ±μ λ€ κ°μ λ°μ΄ν°μ κ³Ό μΈ κ°μ LLM νμ¬λ₯Ό λμμΌλ‘ κ²μ¦νμ§λ§, λ λ€μν λ©ν°λͺ¨λ¬ νκ° μμ κ³Ό LLM μν€ν μ²μ λν μΌλ°ν κ°λ₯μ±μ μΆκ°μ μΌλ‘ νꡬν νμκ° μμ΅λλ€.
PDF 보기
Made with Slashpage