λ³Έ λ
Όλ¬Έμ λΆνμ€μ±μ΄ λμ νκ²½μμ μΌκ΄λ μμ¬κ²°μ μ λ΄λ¦¬λ λ° μ΄λ €μμ΄ μλ κΈ°μ‘΄μ κΈ°λκ° κΈ°λ° κ°ννμ΅μ νκ³λ₯Ό μ§μ νλ©°, μ κ²½λ§μ ν΅ν΄ μ 체 κ²°κ³Ό λΆν¬λ₯Ό λͺ¨λΈλ§νλ λΆν¬ κ°ννμ΅μ λ¨μ μΈ μμ΄μ νΈ κ° κ²°κ³Ό λΆκ· ν λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν΄ BDRL(Boosted Distributional Reinforcement Learning) μκ³ λ¦¬μ¦μ μ μνλ€. BDRLμ μμ΄μ νΈλ³ κ²°κ³Ό λΆν¬λ₯Ό μ΅μ ννλ©΄μ μ μ¬ν μμ΄μ νΈ κ° λΉκ΅ κ°λ₯μ±μ 보μ₯νκ³ , νμ΅ μμ μ±μ λμ΄κΈ° μν΄ μ μ½ μ‘°κ±΄μ΄ μλ λ³Όλ‘ μ΅μ ν λ¬Έμ λ‘ μ 립λ μ¬ν μ
λ°μ΄νΈ ν¬μ κΈ°λ²μ λμ
νλ€.