λ³Έ λ
Όλ¬Έμ μ¬μ νμ΅λ νμ° λͺ¨λΈ λ° νλ¦ κΈ°λ° μμ± λͺ¨λΈμ λ λμ 보μ κ°μ κ°μ§ μνμ μμ±νλλ‘ μ‘°μ νλ 보μ κΈ°λ° νμΈνλ λ°©λ²λ€μ '보μ μ μ λ§€μΉ(Reward Score Matching, RSM)'μ΄λΌλ ν΅ν©λ νλ μμν¬λ‘ μ¬ν΄μν©λλ€. RSM κ΄μ μμ μν μ λ ¬μ κ° ν¨μ μλ΄ νκ²μ λν μ μ λ§€μΉμΌλ‘ κ°μ£Όλλ©°, κΈ°μ‘΄ λ°©λ²λ€μ μ°¨μ΄λ κ° μλ΄ μΆμ κΈ°μ ꡬμ±κ³Ό νμμ€ν
μ λ°μ μ΅μ ν κ°λμ μλ€λ κ²μ 보μ
λλ€. μ΄λ₯Ό ν΅ν΄ λ³Έ μ°κ΅¬λ κΈ°μ‘΄ μ€κ³μ νΈν₯-λΆμ°-κ³μ° νΈλ μ΄λμ€νλ₯Ό λͺ
νν νκ³ , λ¨μνκ³ ν¨μ¨μ μΈ μ¬μ€κ³λ₯Ό μ μν©λλ€.