Sign In

BGM2Pose: Active 3D Human Pose Estimation with Non-Stationary Sounds

Created by
  • Haebom
Category
Empty

저자

Yuto Shibata, Yusuke Oumi, Go Irie, Akisato Kimura, Yoshimitsu Aoki, Mariko Isogawa

개요

BGM2Pose는 임의의 음악(예: 배경 음악)을 능동 감지 신호로 사용하는 비침습적 3D 인체 자세 추정 방법입니다. 가청 범위 내의 침입적인 칩 신호를 사용하여 실용성을 크게 제한하는 기존 방법과 달리, 본 방법은 사람에게 최소한의 불편함을 주는 자연스러운 음악을 활용합니다. 표준 음악으로부터 인체 자세를 추정하는 것은 상당한 어려움을 제시합니다. 측정을 위해 특별히 설계된 음원과 달리, 일반 음악은 볼륨과 피치가 다양합니다. 음악으로 인한 이러한 신호의 역동적인 변화는 인체 움직임으로 인한 음장 변화와 불가피하게 혼합되어 자세 추정을 위한 신뢰할 수 있는 단서를 추출하기 어렵게 만듭니다. 이러한 과제를 해결하기 위해 BGM2Pose는 대조 학습과 하드 네거티브 샘플링을 사용하여 기록된 데이터에서 음악 구성 요소를 제거하고 자세 정보를 분리하는 대조 자세 추출 모듈을 도입합니다. 또한, 주파수 대역에서 동적으로 어텐션을 계산하여 인체 움직임에 기인하는 미묘한 음향 변화에 집중할 수 있도록 주파수별 어텐션 모듈을 제안합니다. 실험 결과, 본 방법이 기존 방법보다 우수하며 실제 응용 프로그램에 대한 상당한 잠재력을 보여줍니다. 데이터셋과 코드는 공개적으로 공유될 예정입니다.

시사점, 한계점

시사점:
비침습적이고 자연스러운 음악을 이용하여 인체 자세 추정이 가능함을 보여줌.
기존 방법보다 우수한 성능을 달성.
실제 응용 분야에 대한 높은 잠재력을 가짐.
데이터셋과 코드 공개를 통해 연구의 재현성 및 확장성 확보.
한계점:
음악의 다양한 볼륨과 피치 변화로 인해 자세 정보 추출의 어려움 존재. (해결 방안 제시되었으나, 실제 성능의 완벽성은 추가 검증 필요)
다양한 환경 및 음악 장르에 대한 일반화 성능 검증 필요.
실제 환경에서의 잡음에 대한 강건성 평가 필요.
👍