Sign In

Found-RL: foundation model-enhanced reinforcement learning for autonomous driving

Created by
  • Haebom
Category
Empty

μ €μž

Yansong Qu, Zihao Sheng, Zilin Huang, Jiancong Chen, Yuhao Luo, Tianyi Wang, Yiheng Feng, Samuel Labi, Sikai Chen

πŸ’‘ κ°œμš”

λ³Έ 논문은 자율 μ£Όν–‰ λΆ„μ•Όμ—μ„œ κ°•ν™”ν•™μŠ΅(RL)의 μƒ˜ν”Œ λΉ„νš¨μœ¨μ„±κ³Ό λ³΅μž‘ν•œ μ‹œλ‚˜λ¦¬μ˜€μ—μ„œμ˜ 해석λ ₯ λΆ€μ‘± 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ λΉ„μ „-μ–Έμ–΄ λͺ¨λΈ(VLM)κ³Ό 같은 νŒŒμš΄λ°μ΄μ…˜ λͺ¨λΈμ„ ν™œμš©ν•˜λŠ” Found-RL을 μ œμ•ˆν•œλ‹€. Found-RL은 비동기 배치 μΆ”λ‘  ν”„λ ˆμž„μ›Œν¬λ₯Ό 톡해 VLM의 높은 μΆ”λ‘  μ§€μ—° μ‹œκ°„μ„ μ™„ν™”ν•˜κ³ , λ‹€μ–‘ν•œ 감독 기법(VMR, AWAG)κ³Ό CLIP 기반 보상 μ„±ν˜•μ„ 톡해 VLM의 지식을 RL 정책에 효과적으둜 ν†΅ν•©ν•œλ‹€. 이λ₯Ό 톡해 κ²½λŸ‰ RL λͺ¨λΈλ‘œλ„ κ±°λŒ€ νŒŒμš΄λ°μ΄μ…˜ λͺ¨λΈμ— μ€€ν•˜λŠ” μ„±λŠ₯을 μ‹€μ‹œκ°„μœΌλ‘œ 달성할 수 μžˆμŒμ„ 보인닀.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
νŒŒμš΄λ°μ΄μ…˜ λͺ¨λΈμ˜ ν’λΆ€ν•œ 지식을 κ°•ν™”ν•™μŠ΅μ˜ μƒ˜ν”Œ νš¨μœ¨μ„± 및 해석λ ₯ λΆ€μ‘± 문제 해결에 효과적으둜 ν™œμš©ν•  수 μžˆμŒμ„ μž…μ¦ν•¨.
β€’
비동기 배치 μΆ”λ‘  ν”„λ ˆμž„μ›Œν¬λ₯Ό 톡해 νŒŒμš΄λ°μ΄μ…˜ λͺ¨λΈμ˜ 높은 μΆ”λ‘  μ§€μ—° μ‹œκ°„μ„ κ·Ήλ³΅ν•˜κ³  μ‹€μ‹œκ°„ κ°•ν™”ν•™μŠ΅ ν›ˆλ ¨μ„ κ°€λŠ₯ν•˜κ²Œ 함.
β€’
κ²½λŸ‰ RL λͺ¨λΈλ‘œλ„ κ±°λŒ€ νŒŒμš΄λ°μ΄μ…˜ λͺ¨λΈμ— μ€€ν•˜λŠ” 자율 μ£Όν–‰ μ„±λŠ₯을 달성할 수 μžˆμŒμ„ λ³΄μ—¬μ€Œ.
β€’
μ œμ•ˆλœ λ°©λ²•λ‘ μ˜ μΌλ°˜ν™” κ°€λŠ₯μ„± 및 λ‹€μ–‘ν•œ νŒŒμš΄λ°μ΄μ…˜ λͺ¨λΈκ³Όμ˜ 톡합 κ°€λŠ₯성에 λŒ€ν•œ μΆ”κ°€ 연ꡬ가 ν•„μš”ν•¨.
πŸ‘