haebom
Sign In
VECTOR-Drive: Tightly Coupled Vision-Language and Trajectory Expert Routing for End-to-End Autonomous Driving
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Rui Zhao, Jianlin Yu, Zhenhai Gao, Jiaqiao Liu, Fei Gao
π‘ κ°μ
λ³Έ λ Όλ¬Έμ μ’ λ¨κ°(end-to-end) μμ¨ μ£Όνμ μν Qwen2.5-VL-3B κΈ°λ°μ tightly coupled VLA(Vision-Language-Action) νλ μμν¬μΈ VECTOR-DRIVEλ₯Ό μ μν©λλ€. VECTOR-DRIVEλ λͺ¨λ ν ν°μ 곡μ μ ν μ΄ν μ μΌλ‘ μ°κ²°νλ, ν ν° μλ―Έμ λ°λΌ νΌλν¬μλ μ°μ°μ Vision-Language Expertμ Trajectory Expertλ‘ λΆκΈ°νμ¬ μ²λ¦¬ν©λλ€. μ΄λ₯Ό ν΅ν΄ μλ―Έλ‘ μ μ΄ν΄μ κΆ€μ μμΈ‘ κ°μ μ₯μ μ κ²°ν©νλ©΄μλ κ³Όλν νμ€ν¬ κ° μΆ©λμ λ°©μ§ν©λλ€.
π μμ¬μ λ° νκ³
β’
μλ―Έλ‘ μ μ 보μ κΆ€μ κ³νμ κΈ΄λ°ν κ²°ν©:
곡μ μ ν μ΄ν μ λ©μ»€λμ¦μ λΉμ λ° μΈμ΄ μ 보μ νλΆν μλ―Έλ‘ μ μ¬μ μ§μμ μ μ§νλ©΄μλ, νΈλν½ μν© μ΄ν΄μ μ£Όν μλ μΆλ‘ μ κΆ€μ κ³νκ³Ό ν¨κ³Όμ μΌλ‘ μ°κ²°ν©λλ€.
β’
νμ€ν¬λ³ μ λ¬Ένλ μ°μ°:
ν ν°μ μλ―Έμ λ°λΌ Vision-Language Expertμ Trajectory Expertλ‘ μ°μ°μ λΌμ°ν ν¨μΌλ‘μ¨, κ° μ λ¬Έκ°κ° ν΄λΉ νμ€ν¬μ μ΅μ νλ μ°μ°μ μννλλ‘ νμ¬ ν¨μ¨μ±κ³Ό μ±λ₯μ ν₯μμν΅λλ€.
β’
μ λ νλ¦(Flow-matching) κΈ°λ°μ μ κ΅ν κΆ€μ μμ±:
λ Έμ΄μ¦κ° ν¬ν¨λ μ‘μ ν ν°μ μ λ νλ¦ νλλλ₯Ό ν΅ν΄ λ―Έλ μ¨μ΄ν¬μΈνΈμ μλ νλ‘νμΌλ‘ μ κ΅νκ² μμ±νμ¬ μμ νκ³ μ€ν κ°λ₯ν μ£Όν κ³νμ μ립ν©λλ€.
β’
νκ³μ :
β¦
λ Όλ¬Έμμ μ μλ λ²€μΉλ§ν¬(Bench2Drive)μμμ μ±λ₯ μ°μμ±μ΄ μ€μ λ€μν νκ²½μμμ μΌλ°ν μ±λ₯μΌλ‘ μ΄μ΄μ§μ§λ μΆκ°μ μΈ κ²μ¦μ΄ νμν©λλ€.
β¦
Qwen2.5-VL-3B λͺ¨λΈμ μ μ½ μ¬νμ΄λ computational costμ λν μμΈν λΆμμ΄ λΆμ‘±ν μ μμ΅λλ€.
PDF 보기
Made with Slashpage