μ΄ λ
Όλ¬Έμ μ°μ νλ κ°ννμ΅μμ νμ° λλ νλ¦ λ§€μΉ μ μ±
μ ν¨μ¨μ μΈ μ΅μ ν λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν μλ‘μ΄ TD κΈ°λ° κ°ννμ΅ μκ³ λ¦¬μ¦μΈ Q-learning with Adjoint Matching (QAM)μ μ μν©λλ€. QAMμ μμ± λͺ¨λΈλ§μμ μ μλ 'adjoint matching' κΈ°λ²μ νμ©νμ¬, λΆμμ ν μμ ν μμ΄λ λΉνΈν₯μ μ΄κ³ ννλ ₯μ΄ νλΆν μ μ±
μ νμ΅ν μ μλλ‘ ν©λλ€. μ΄λ₯Ό ν΅ν΄ κΈ°μ‘΄ λ°©λ²λ‘ μ νκ³λ₯Ό 극볡νκ³ , ν¬μ 보μ νκ²½μμ λ°μ΄λ μ±λ₯μ 보μ¬μ€λλ€.