haebom
Sign In
CoWorld-VLA: Thinking in a Multi-Expert World Model for Autonomous Driving
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Minqing Huang, Yujiao Xiang, Zihan Liang, Jiajie Huang, Jingqi Wang, Zhi Xu, Feiyang Tan, Hangning Zhou, Mu Yang, Gong Che
π‘ κ°μ
λ³Έ λ Όλ¬Έμ μμ¨ μ£Όνμ μν Vision-Language-Action (VLA) λͺ¨λΈμ νκ³μ μ 극볡νκ³ μ, λ€μ€ μ λ¬Έκ° κΈ°λ° μλ λͺ¨λΈλ§ νλ μμν¬μΈ CoWorld-VLAλ₯Ό μ μν©λλ€. CoWorld-VLAλ ν μ€νΈ κΈ°λ°μ CoTκ° μ곡κ°μ μ°μμ±μ 보쑴νκΈ° μ΄λ ΅κ³ μ μ¬μ μλ μΆλ‘ μ΄ νλ μμ±μ μ§μ μ¬μ©λκΈ° μ΄λ ΅λ€λ λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν΄, λ€μν μμ€μ μ 보λ₯Ό νμ©νμ¬ 4κ°μ§ μ’ λ₯μ μ λ¬Έκ° ν ν°μΌλ‘ μμΆλ λͺ μμ μΈ μλ ννμ μμ±ν©λλ€. μ΄λ κ² μμ±λ μ λ¬Έκ° ν ν°λ€μ νλ κ³νμ μν λͺ νν 쑰건μΌλ‘ μ¬μ©λμ΄, νμ° κΈ°λ°μ κ³μΈ΅μ λ€μ€ μ λ¬Έκ° μ΅ν© κ³νμκ° μ°μμ μΈ μ£Όν κΆ€μ μ μμ±νλλ‘ μ λν©λλ€.
π μμ¬μ λ° νκ³
β’
λͺ μμ μλ ννμ ν΅ν νλ κ³ν κ°ν:
CoWorld-VLAλ ν μ€νΈλ μ μ¬ λ³μμ μμ‘΄νλ κΈ°μ‘΄ λ°©μκ³Ό λ¬λ¦¬, μλ―Έλ‘ μ μνΈμμ©, κΈ°ννμ ꡬ쑰, λμ λ³ν, μμ°¨ κΆ€μ λ± κ΅¬μ²΄μ μΈ μλ μ 보λ₯Ό μ λ¬Έκ° ν ν°μΌλ‘ μ 곡νμ¬ μμ¨ μ£Όν μμ€ν μ κ³ν λ₯λ ₯μ ν₯μμν΅λλ€.
β’
λ€μ€ μ λ¬Έκ°μ μλμ§ ν¨κ³Ό:
κ°κΈ° λ€λ₯Έ μΈ‘λ©΄μ ν¬κ΄νλ 4κ°μ§ μ’ λ₯μ μ λ¬Έκ° ν ν°μ μλ‘ λ³΄μμ μΈ μ 보λ₯Ό μ 곡νλ©°, μ΄λ₯Ό ν΅ν©νμ¬ λμ± κ°κ±΄νκ³ μ νν νλ μμΈ‘ λ° μμ±μ κΈ°μ¬ν©λλ€.
β’
μ곡κ°μ μ°μμ± ν보 λ° νμ€μ μΈ κΆ€μ μμ±:
νμ° λͺ¨λΈ κΈ°λ°μ κ³νμλ μμ± κ³Όμ μ λ°μ κ±Έμ³ μ₯λ©΄ λ§₯λ½μ κ³ λ €νμ¬ μκ°μ λ°λΌ μ°μμ μΈ μ£Όν κΆ€μ μ μμ±νλ©°, μ΄λ₯Ό ν΅ν΄ μ€μ μ£Όν νκ²½μμμ μΆ©λ ννΌ λ° κΆ€μ μ νλλ₯Ό λμ λλ€.
β’
νκ³μ :
λ³Έ μ°κ΅¬λ NAVSIM v1 λ²€μΉλ§ν¬μμ μ±λ₯μ κ²μ¦νμμΌλ, μ€μ 볡μ‘νκ³ μμΈ‘ λΆκ°λ₯ν λ€μν μ£Όν μλ리μ€μ λν νμ₯μ± λ° μΌλ°ν μ±λ₯ κ²μ¦μ΄ μΆκ°μ μΌλ‘ νμν μ μμ΅λλ€. λν, κ° μ λ¬Έκ° ν ν°μ μ 보 μΆμΆ λ° μ΅ν© κ³Όμ μμ λ°μν μ μλ μ 보 μμ€μ΄λ νΈν₯μ λν λΆμλ ν₯ν μ°κ΅¬ κ³Όμ κ° λ μ μμ΅λλ€.
PDF 보기
Made with Slashpage