Sign In

Self-supervised Hierarchical Visual Reasoning with World Model

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Yuanfei Xu, Lin Liu, Wengang Zhou, Mingxiao Feng, Houqiang Li

πŸ’‘ κ°œμš”

λ³Έ 논문은 λ³΅μž‘ν•œ 3D μ˜€ν”ˆ μ›”λ“œ ν™˜κ²½μ—μ„œ κ°•ν™”ν•™μŠ΅ μ—μ΄μ „νŠΈμ˜ 핡심 과제인 λ°©λŒ€ν•œ μƒνƒœ 곡간 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•œ μƒˆλ‘œμš΄ 계측적 자기 지도 ν•™μŠ΅ 기반 μ‹œκ°μ  μΆ”λ‘  방법둠인 ResDreamerλ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. ResDreamerλŠ” 각 μƒμœ„ 계측이 ν•˜μœ„ κ³„μΈ΅μ˜ μž”μ°¨λ₯Ό μž¬κ΅¬μ„±ν•˜λ„λ‘ ν›ˆλ ¨ν•˜λŠ” λ…νŠΉν•œ ꡬ쑰λ₯Ό 톡해 점진적인 좔상화λ₯Ό 이루고 ν’λΆ€ν•œ 잠재 ν‘œν˜„μ„ μƒμ„±ν•©λ‹ˆλ‹€. 순수 자기 지도 ν•™μŠ΅μœΌλ‘œ ν›ˆλ ¨λœ ResDreamerλŠ” μƒ˜ν”Œ νš¨μœ¨μ„±κ³Ό νŒŒλΌλ―Έν„° νš¨μœ¨μ„±μ—μ„œ μ΅œμ²¨λ‹¨ μ„±λŠ₯을 λ‹¬μ„±ν•˜λ©°, 개방적이고 역동적인 ν™˜κ²½μ—μ„œ 온라인 RL μ—μ΄μ „νŠΈμ˜ λŠ₯λ ₯을 ν–₯μƒμ‹œν‚¬ 수 μžˆλŠ” κ°€λŠ₯성을 μ œμ‹œν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
μ‹œκ°μ  μΆ”λ‘ μ—μ„œ 물리적 좩싀도보닀 μž‘μ—… κ΄€λ ¨μ„± μžˆλŠ” μ‹ ν˜Έκ°€ 더 μ€‘μš”ν•˜λ‹€λŠ” μƒˆλ‘œμš΄ 톡찰λ ₯을 μ œκ³΅ν•©λ‹ˆλ‹€.
β€’
계측적 μž”μ°¨ μž¬κ΅¬μ„±μ„ 톡해 효과적으둜 μΆ”μƒν™”λ˜κ³  ν’λΆ€ν•œ 잠재 ν‘œν˜„μ„ μƒμ„±ν•˜λŠ” ν™•μž₯ κ°€λŠ₯ν•œ 세계 λͺ¨λΈ μ•„ν‚€ν…μ²˜λ₯Ό μ œμ‹œν•©λ‹ˆλ‹€.
β€’
순수 자기 지도 ν•™μŠ΅ μ ‘κ·Ό 방식을 톡해 λ³΅μž‘ν•œ ν™˜κ²½μ—μ„œ κ°•ν™”ν•™μŠ΅ μ—μ΄μ „νŠΈμ˜ μƒ˜ν”Œ 및 νŒŒλΌλ―Έν„° νš¨μœ¨μ„±μ„ 크게 ν–₯μƒμ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
λ³Έ μ—°κ΅¬μ˜ ν•œκ³„μ μ€ 아직 λͺ…μ‹œμ μœΌλ‘œ μ–ΈκΈ‰λ˜μ§€ μ•Šμ•˜μœΌλ‚˜, ν–₯ν›„ κ³Όμ œλ‘œλŠ” λ‹€μ–‘ν•œ μ’…λ₯˜μ˜ λ³΅μž‘ν•œ μ‹œκ°μ  μΆ”λ‘  μž‘μ—…μœΌλ‘œμ˜ μΌλ°˜ν™” 및 μ‹€μ œ 적용 κ°€λŠ₯μ„± 검증 등이 μžˆμ„ 수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘