Sign In

Bi-Level Prompt Optimization for Multimodal LLM-as-a-Judge

Created by
  • Haebom
Category
Empty

μ €μž

Bo Pan, Xuan Kan, Kaitai Zhang, Yan Yan, Shunwen Tan, Zihao He, Zixin Ding, Junjie Wu, Liang Zhao

πŸ’‘ κ°œμš”

이 논문은 λ©€ν‹°λͺ¨λ‹¬ LLM을 이미지 ν‰κ°€μ˜ μžλ™ νŒμ‚¬λ‘œ ν™œμš©ν•  λ•Œ λ°œμƒν•˜λŠ” 인간 νŒλ‹¨κ³Όμ˜ μ •λ ¬ 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•œ ν”„λ‘¬ν”„νŠΈ μ΅œμ ν™” 방법을 μ œμ•ˆν•©λ‹ˆλ‹€. μ œν•œλœ μ»¨ν…μŠ€νŠΈ 창으둜 인해 λ©€ν‹°λͺ¨λ‹¬ λͺ¨λΈμ΄ λ§Žμ€ μ‹œκ°μ  예제λ₯Ό μ²˜λ¦¬ν•˜κΈ° μ–΄λ ΅λ‹€λŠ” 병λͺ© ν˜„μƒμ„ κ·Ήλ³΅ν•˜κΈ° μœ„ν•΄, μ΄λ―Έμ§€μ˜ 핡심 μ‹œκ° 정보λ₯Ό ν…μŠ€νŠΈλ‘œ λ³€ν™˜ν•˜λŠ” λ™μ‹œμ— 평가 κ΄€λ ¨ λ‹¨μ„œλ₯Ό μœ μ§€ν•˜λŠ” Bi-Level Prompt Optimization (BLPO) ν”„λ ˆμž„μ›Œν¬λ₯Ό κ°œλ°œν–ˆμŠ΅λ‹ˆλ‹€. BLPOλŠ” νŒμ‚¬ ν”„λ‘¬ν”„νŠΈμ™€ 이미지-ν…μŠ€νŠΈ λ³€ν™˜ ν”„λ‘¬ν”„νŠΈλ₯Ό κ³΅λ™μœΌλ‘œ μ΅œμ ν™”ν•˜μ—¬ μ œν•œλœ μ»¨ν…μŠ€νŠΈ μ˜ˆμ‚° λ‚΄μ—μ„œ 평가 좩싀도λ₯Ό μœ μ§€ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
λ©€ν‹°λͺ¨λ‹¬ LLM을 μžλ™ νŒμ‚¬λ‘œ μ‚¬μš©ν•  λ•Œ λ°œμƒν•˜λŠ” μ»¨ν…μŠ€νŠΈ μ°½ μ œμ•½ 문제λ₯Ό κ·Ήλ³΅ν•˜κ³ , 평가 κ΄€λ ¨ μ‹œκ° 정보λ₯Ό 효과적으둜 ν…μŠ€νŠΈλ‘œ λ³€ν™˜ν•˜λŠ” μƒˆλ‘œμš΄ μ ‘κ·Ό 방식을 μ œμ‹œν–ˆμŠ΅λ‹ˆλ‹€.
β€’
이미지-ν…μŠ€νŠΈ λ³€ν™˜κ³Ό νŒμ‚¬ ν”„λ‘¬ν”„νŠΈ μ΅œμ ν™”λ₯Ό λ™μ‹œμ— μ§„ν–‰ν•˜λŠ” ν”„λ ˆμž„μ›Œν¬λ₯Ό 톡해 μ œν•œλœ μžμ› ν•˜μ—μ„œ 높은 평가 μ„±λŠ₯을 달성할 수 μžˆμŒμ„ μž…μ¦ν–ˆμŠ΅λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ λ°©λ²•λ‘ μ˜ νš¨κ³Όμ„±μ„ λ„€ 개의 데이터셋과 μ„Έ 개의 LLM νŒμ‚¬λ₯Ό λŒ€μƒμœΌλ‘œ κ²€μ¦ν–ˆμ§€λ§Œ, 더 λ‹€μ–‘ν•œ λ©€ν‹°λͺ¨λ‹¬ 평가 μž‘μ—…κ³Ό LLM μ•„ν‚€ν…μ²˜μ— λŒ€ν•œ μΌλ°˜ν™” κ°€λŠ₯성을 μΆ”κ°€μ μœΌλ‘œ 탐ꡬ할 ν•„μš”κ°€ μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘