haebom
Sign In
Projecting Latent RL Actions: Towards Generalizable and Scalable Graph Combinatorial Optimization
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Franco Terranova (UL, LORIA, Inria), Guillermo Bernardez (UC Santa Barbara), Albert Cabellos-Aparicio (UPC), Nina Miolane (UC Santa Barbara), Abdelkader Lahmadi (LORIA, UL, Inria)
π‘ κ°μ
λ³Έ λ Όλ¬Έμ 볡μ‘ν κ·Έλν μ‘°ν© μ΅μ ν λ¬Έμ ν΄κ²°μ μν΄ κΈ°μ‘΄ κ°ννμ΅(RL) λ° κ·Έλν μ κ²½λ§(GNN) κΈ°λ° μ κ·Ό λ°©μμ μΌλ°ν λ° νμ₯μ± νκ³λ₯Ό 극볡νκ³ μ ν©λλ€. μ΄λ₯Ό μν΄ GNN κΈ°λ° μ°μμ μΈ μ μ¬ νλ μλ² λ© κ³΅κ°μμ μ§μ μλνλ 'νλ‘μ μ μμ΄μ νΈ'λ₯Ό μ μνλ©°, λ¨μΌ μλ°©ν₯ ν΅κ³Όλ‘ μνλ μ μ¬ νλμ μμΈ‘νκ³ μ΄λ₯Ό μ ν¨ν μ΄μ° νλμΌλ‘ λμ½λ©νλ λ°©μμ μ¬μ©ν©λλ€. μ΄ λ°©λ²μ λ€μν λ²€μΉλ§ν¬μμ κΈ°μ‘΄ μ루μ λλΉ μ΅λ 16.2λ°° λΉ λ₯Έ μΆλ‘ μλμ 40% ν₯μλ μΌλ°ν μ±λ₯μ λ¬μ±νμ΅λλ€.
π μμ¬μ λ° νκ³
β’
GNN κΈ°λ° μ μ¬ νλ μλ² λ© κ³΅κ°μ ν΅ν΄ μΌλ°ν λ° νμ₯μ± λ¬Έμ λ₯Ό ν¨κ³Όμ μΌλ‘ ν΄κ²°ν μ μμ΅λλ€.
β’
λ¨μΌ μλ°©ν₯ ν΅κ³Όλ‘ μ μ¬ νλμ μμΈ‘νκ³ λμ½λ©νλ λ°©μμ μΆλ‘ μλλ₯Ό ν¬κ² ν₯μμν΅λλ€.
β’
'LaGCO-RL' λΌμ΄λΈλ¬λ¦¬ 곡κ°λ RL-GCO μ°κ΅¬μ μ¬νμ±κ³Ό μ μμ±μ μ¦μ§μν΅λλ€.
β’
λ¨μν μ΅κ·Όμ μ΄μ λμ½λ©λ§μΌλ‘λ λμ μ±λ₯μ λ¬μ±νμ§λ§, λ 볡μ‘ν λμ½λ© μ λ΅μ ν΅ν΄ μ±λ₯μ λμ± κ°μ ν μ¬μ§κ° μμ΅λλ€.
PDF 보기
Made with Slashpage