Sign In

ART for Diffusion Sampling: A Reinforcement Learning Approach to Timestep Schedule

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Yilie Huang, Wenpin Tang, Xunyu Zhou

πŸ’‘ κ°œμš”

λ³Έ 논문은 ν™•μ‚° λͺ¨λΈμ˜ μƒ˜ν”Œ 생성 κ³Όμ •μ—μ„œ μ‹œκ°„ 이산화 문제의 λΉ„νš¨μœ¨μ„±μ„ ν•΄κ²°ν•˜κΈ° μœ„ν•΄ 'Adaptive Reparameterized Time (ART)'λΌλŠ” μƒˆλ‘œμš΄ 방법을 μ œμ•ˆν•©λ‹ˆλ‹€. ARTλŠ” μž¬λ§€κ°œλ³€μˆ˜ν™”λœ μ‹œκ°„ λ³€μˆ˜μ˜ 속도λ₯Ό μ‘°μ ˆν•˜μ—¬ μƒ˜ν”Œλ§ ꢀ적에 λ”°λ₯Έ κ³„μ‚°λŸ‰μ„ μž¬λΆ„λ°°ν•¨μœΌλ‘œμ¨ λˆ„μ  였차λ₯Ό μ΅œμ†Œν™”ν•˜λŠ” 것을 λͺ©ν‘œλ‘œ ν•©λ‹ˆλ‹€. 이λ₯Ό κ°•ν™”ν•™μŠ΅ 문제둜 ν™•μž₯ν•œ ART-RL은 μ˜€ν”„λΌμΈ ν•™μŠ΅ 후에도 λ‹€μ–‘ν•œ λ°μ΄ν„°μ…‹μ—μ„œ μΆ”κ°€ μΆ”λ‘  λΉ„μš© 없이 μ„±λŠ₯ ν–₯상을 λ³΄μ—¬μ€λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
ν™•μ‚° λͺ¨λΈ μƒ˜ν”Œλ§ μ‹œ μ‹œκ°„ 단계별 κ³„μ‚°λŸ‰ 배뢄을 μ΅œμ ν™”ν•˜μ—¬ νš¨μœ¨μ„±μ„ 크게 ν–₯μƒμ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ ART-RL 방법은 ν•™μŠ΅λœ 결정둠적 μ‹œκ°„ μŠ€μΌ€μ€„μ„ λ‹€λ₯Έ λͺ¨λΈμ— μž¬μ‚¬μš©ν•  수 μžˆμ–΄ λ²”μš©μ„±μ„ ν™•λ³΄ν–ˆμŠ΅λ‹ˆλ‹€.
β€’
κ°•ν™”ν•™μŠ΅μ„ ν†΅ν•œ μ‹œκ°„ μŠ€μΌ€μ€„ μ΅œμ ν™”λŠ” κ³„μ‚°λŸ‰μ΄ 많고, μ‹€μ œ 적용 μ‹œμ—λŠ” 더 넓은 λ²”μœ„μ˜ λͺ¨λΈ μ•„ν‚€ν…μ²˜μ™€ 데이터셋에 λŒ€ν•œ μΌλ°˜ν™” μ„±λŠ₯ 검증이 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘