Sign In

Robust Checkpoint Selection for Multimodal LLMs via Agentic Evaluation and Stability-Aware Ranking

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Qinwu Xu, Zhuoheng Li, Jessie Salas

πŸ’‘ κ°œμš”

λ³Έ 논문은 κΈ°μ‘΄ λ°©μ‹μ˜ ν•œκ³„λ₯Ό κ·Ήλ³΅ν•˜κΈ° μœ„ν•΄ 평가 λΆˆν™•μ‹€μ„± ν•˜μ—μ„œμ˜ κ°•κ±΄ν•œ μ˜μ‚¬κ²°μ • 문제둜 λ©€ν‹°λͺ¨λ‹¬ λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(MLLM)의 체크포인트 선택을 μž¬μ •μ˜ν•©λ‹ˆλ‹€. 싀세계 데이터, LLM 기반 νŒλ‹¨, 닀단계 λž­ν‚Ή ν”„λ‘œν† μ½œμ„ ν†΅ν•©ν•œ 닀단계 ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•˜λ©°, 이λ₯Ό 톡해 λ―Έμ„Έν•œ μ„±λŠ₯ 차이와 λ…Έμ΄μ¦ˆμ— κ°•κ±΄ν•˜λ©΄μ„œλ„ μ‹€μ œ μ‚¬μš© μ‹œλ‚˜λ¦¬μ˜€μ— 더 잘 λΆ€ν•©ν•˜λŠ” 체크포인트 선택 방법을 μ œμ‹œν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
μ œμ•ˆλœ 닀단계 평가 ν”„λ ˆμž„μ›Œν¬λŠ” 기쑴의 정적 λ²€μΉ˜λ§ˆν¬λ‚˜ 점수 기반 방식보닀 μ‹€μ œ ν™˜κ²½μ—μ„œμ˜ MLLM μ„±λŠ₯을 더 μ‹ λ’°μ„± 있게 μ˜ˆμΈ‘ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
OCR νŒλ…μ„±μ˜ μ€‘μš”μ„±μ„ κ°•μ‘°ν•˜λ©°, 데이터 ν’ˆμ§ˆμ΄ 평가 μœ νš¨μ„±μ— λ―ΈμΉ˜λŠ” 영ν–₯을 λΆ„μ„ν•˜κ³  이λ₯Ό 평가 과정에 λ°˜μ˜ν•˜λŠ” 방법을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ λ°©λ²•λ‘ μ˜ 계산 λ³΅μž‘μ„±κ³Ό μ‹€μ œ 적용 μ‹œ μš”κ΅¬λ˜λŠ” 데이터 νλ ˆμ΄μ…˜ 및 LLM 기반 νŒλ‹¨μ˜ μžλ™ν™” μ •λ„λŠ” 좔가적인 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘