haebom
Sign In
Found-RL: foundation model-enhanced reinforcement learning for autonomous driving
Created by
Haebom
Category
Empty
μ μ
Yansong Qu, Zihao Sheng, Zilin Huang, Jiancong Chen, Yuhao Luo, Tianyi Wang, Yiheng Feng, Samuel Labi, Sikai Chen
π‘ κ°μ
λ³Έ λ Όλ¬Έμ μμ¨ μ£Όν λΆμΌμμ κ°ννμ΅(RL)μ μν λΉν¨μ¨μ±κ³Ό 볡μ‘ν μλ리μ€μμμ ν΄μλ ₯ λΆμ‘± λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν΄ λΉμ -μΈμ΄ λͺ¨λΈ(VLM)κ³Ό κ°μ νμ΄λ°μ΄μ λͺ¨λΈμ νμ©νλ Found-RLμ μ μνλ€. Found-RLμ λΉλκΈ° λ°°μΉ μΆλ‘ νλ μμν¬λ₯Ό ν΅ν΄ VLMμ λμ μΆλ‘ μ§μ° μκ°μ μννκ³ , λ€μν κ°λ κΈ°λ²(VMR, AWAG)κ³Ό CLIP κΈ°λ° λ³΄μ μ±νμ ν΅ν΄ VLMμ μ§μμ RL μ μ± μ ν¨κ³Όμ μΌλ‘ ν΅ν©νλ€. μ΄λ₯Ό ν΅ν΄ κ²½λ RL λͺ¨λΈλ‘λ κ±°λ νμ΄λ°μ΄μ λͺ¨λΈμ μ€νλ μ±λ₯μ μ€μκ°μΌλ‘ λ¬μ±ν μ μμμ 보μΈλ€.
π μμ¬μ λ° νκ³
β’
νμ΄λ°μ΄μ λͺ¨λΈμ νλΆν μ§μμ κ°ννμ΅μ μν ν¨μ¨μ± λ° ν΄μλ ₯ λΆμ‘± λ¬Έμ ν΄κ²°μ ν¨κ³Όμ μΌλ‘ νμ©ν μ μμμ μ μ¦ν¨.
β’
λΉλκΈ° λ°°μΉ μΆλ‘ νλ μμν¬λ₯Ό ν΅ν΄ νμ΄λ°μ΄μ λͺ¨λΈμ λμ μΆλ‘ μ§μ° μκ°μ 극볡νκ³ μ€μκ° κ°ννμ΅ νλ ¨μ κ°λ₯νκ² ν¨.
β’
κ²½λ RL λͺ¨λΈλ‘λ κ±°λ νμ΄λ°μ΄μ λͺ¨λΈμ μ€νλ μμ¨ μ£Όν μ±λ₯μ λ¬μ±ν μ μμμ 보μ¬μ€.
β’
μ μλ λ°©λ²λ‘ μ μΌλ°ν κ°λ₯μ± λ° λ€μν νμ΄λ°μ΄μ λͺ¨λΈκ³Όμ ν΅ν© κ°λ₯μ±μ λν μΆκ° μ°κ΅¬κ° νμν¨.
PDF 보기
Made with Slashpage