Sign In

How to Guide Your Flow: Few-Step Alignment via Flow Map Reward Guidance

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Jerry Y. Huang, Justin Lin, Sheel Shah, Kartik Nair, Nicholas M. Boffi

πŸ’‘ κ°œμš”

λ³Έ 논문은 생성 λͺ¨λΈμ—μ„œ μ‚¬μš©μžκ°€ μ§€μ •ν•œ 보상(예: 심미성, 인간 μ„ ν˜Έλ„)을 μ΅œλŒ€ν™”ν•˜λŠ” μƒ˜ν”Œμ„ μƒμ„±ν•˜λŠ” 문제인 'κ°€μ΄λ˜μŠ€'λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ μƒˆλ‘œμš΄ μ ‘κ·Ό 방식을 μ œμ•ˆν•©λ‹ˆλ‹€. κΈ°μ‘΄ λ°©λ²•μ˜ ν•œκ³„λ₯Ό κ·Ήλ³΅ν•˜κ³ μž κ°€μ΄λ˜μŠ€λ₯Ό 결정둠적 졜적 μ œμ–΄ 문제둜 μž¬μ •μ˜ν•˜κ³ , 졜근 μ£Όλͺ©λ°›λŠ” 'ν”Œλ‘œμš° λ§΅'을 μ΅œμ ν•΄μ˜ μžμ—°μŠ€λŸ¬μš΄ 결과물둜 λ„μΆœν–ˆμŠ΅λ‹ˆλ‹€. 이λ₯Ό 기반으둜 μ œμ•ˆλœ FMRG(Flow Map Reward Guidance)λŠ” ν›ˆλ ¨ 없이 단일 ꢀ적을 μ‚¬μš©ν•˜μ—¬ ν”Œλ‘œμš° 맡을 톡해 μƒ˜ν”Œ 생성 과정을 ν†΅ν•©ν•˜κ³  μ•ˆλ‚΄ν•¨μœΌλ‘œμ¨, ν…μŠ€νŠΈ-이미지 생성 λΆ„μ•Όμ—μ„œ 적은 NFEs(Number of Function Evaluations)λ§ŒμœΌλ‘œλ„ κΈ°μ‘΄ 졜고 μˆ˜μ€€μ˜ μ„±λŠ₯을 λ‹¬μ„±ν•˜κ±°λ‚˜ λŠ₯κ°€ν•˜λ©° 속도λ₯Ό 크게 ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
생성 λͺ¨λΈμ˜ κ°€μ΄λ˜μŠ€ 문제λ₯Ό 졜적 μ œμ–΄ 문제둜 μž¬μ •μ˜ν•˜μ—¬ 이둠적 κΈ°λ°˜μ„ κ°•ν™”ν•˜κ³ , ν”Œλ‘œμš° 맡의 역할을 λͺ…ν™•νžˆ 규λͺ…ν–ˆμŠ΅λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ FMRGλŠ” ν›ˆλ ¨μ΄ ν•„μš” μ—†κ³  단일 κΆ€μ λ§Œμ„ μ‚¬μš©ν•˜λ©°, 적은 NFEsλ‘œλ„ λ›°μ–΄λ‚œ μ„±λŠ₯을 보여 κΈ°μ‘΄ 방법 λŒ€λΉ„ μƒλ‹Ήν•œ 속도 ν–₯상을 λ‹¬μ„±ν–ˆμŠ΅λ‹ˆλ‹€.
β€’
ν…μŠ€νŠΈ-이미지 생성에 νš¨κ³Όμ μž„μ„ μž…μ¦ν•˜μ˜€μœΌλ‚˜, λ‹€λ₯Έ 생성 λͺ¨λΈ λΆ„μ•Ό(예: μŒμ„±, 3D λͺ¨λΈ)둜의 ν™•μž₯μ„± 및 λ‹€μ–‘ν•œ 보상 ν•¨μˆ˜μ— λŒ€ν•œ μΌλ°˜ν™” κ°€λŠ₯성은 μΆ”κ°€ 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘