A Survey of Multi-sensor Fusion Perception for Embodied AI: Background, Methods, Challenges and Prospects
Created by
Haebom
저자
Shulan Ruan, Rongwei Wang, Xuchen Shen, Huijie Liu, Baihui Xiao, Jun Shi, Kun Zhang, Zhenya Huang, Yu Liu, Enhong Chen, You He
개요
본 논문은 다중 센서 융합 인식(MSFP)에 대한 종합적인 검토를 제공합니다. 기존 연구들이 특정 작업이나 연구 분야에 치우쳐 다른 분야 연구자들에게 도움이 되지 못하는 한계를 지적하며, 작업에 구애받지 않는 관점에서 MSFP 연구를 체계적으로 정리합니다. 다양한 기술적 관점(다중 모드 융합, 다중 뷰 융합, 시계열 융합, 다중 모드 LLM 융합 등)에서 MSFP 방법들을 검토하고, 향후 연구 방향을 제시합니다. 특히, 최근 주목받는 대규모 언어 모델(LLM)을 활용한 다중 모드 융합 방법 또한 다룹니다.
시사점, 한계점
•
시사점:
◦
기존 연구의 한계를 극복하고, 작업에 구애받지 않는 다양한 관점에서 MSFP 방법론을 종합적으로 제시합니다.
◦
다중 모드, 다중 뷰, 시계열 융합뿐 아니라, LLM 기반 다중 모드 융합 방법까지 포함하여 최신 동향을 반영합니다.
◦
MSFP 분야 연구자들에게 중요한 진전을 이해하고 미래 연구를 위한 통찰력을 제공합니다.
•
한계점:
◦
논문에서 언급된 바와 같이, 아직은 초기 단계의 연구 결과를 다루고 있어, 향후 더 많은 연구가 필요할 수 있습니다.