ChatMotion: A Multimodal Multi-Agent for Human Motion Analysis

작성자

Haebom

카테고리

비어 있음

저자

Li Lei, Jia Sen, Wang Jianhao, An Zhaochong, Li Jiaang, Hwang Jenq-Neng, Belongie Serge

개요

ChatMotion은 다양한 분석 관점에 대한 상호작용 및 적응성이 부족한 기존의 "지시만 하는" 방식의 다중 모드 대규모 언어 모델(MLLM)의 한계를 극복하기 위해 제안된 다중 모드 다중 에이전트 프레임워크입니다. 사용자 의도를 동적으로 해석하고 복잡한 작업을 메타 작업으로 분해하여 동작 이해를 위한 특수 기능 모듈을 활성화합니다. MotionCore와 같은 여러 특수 모듈을 통합하여 다양한 관점에서 인간의 동작을 분석하며, 실험 결과 정확성, 적응성 및 사용자 참여도가 향상됨을 보여줍니다.