Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

HAR-DoReMi: Optimizing Data Mixture for Self-Supervised Human Activity Recognition Across Heterogeneous IMU Datasets

Created by
  • Haebom
Category
Empty

저자

Lulu Ban, Tao Zhu, Xiangqing Lu, Qi Qiu, Wenyong Han, Shuangjian Li, Liming Chen, Kevin I-Kai Wang, Mingxing Nie, Yaping Wan

개요

본 논문은 다양한 데이터셋에서의 인간 활동 인식(HAR) 모델의 일반화 성능 저하 문제를 해결하기 위해, 대규모 언어 모델(LLM)의 DoReMi 기법에서 영감을 얻은 새로운 데이터 혼합 최적화 전략을 제시합니다. 기존 DoReMi를 IMU 센서 데이터의 연속적이고 다채널이며 이질적인 특성에 맞게 수정한 HAR-DoReMi 프레임워크를 제안하며, Mean Squared Error(MSE) 손실 기반의 마스크 재구성 작업을 도입하여 연속적인 IMU 데이터 처리에 적합하도록 하였습니다. 또한, Mahony 퓨전 알고리즘을 통합하여 다양한 센서 방향의 이질성을 완화하고, 데이터셋 간의 센서 방향을 통일된 좌표계에 맞춰 정렬함으로써 모델의 교차 데이터셋 일반화 능력을 향상시킵니다. 실험 결과, HAR-DoReMi는 기존 최첨단 방법보다 평균 6.51% 향상된 정확도를 달성했으며, 데이터 사용량은 약 30%~50% 수준으로 줄였습니다.

시사점, 한계점

시사점:
DoReMi 기반의 데이터 혼합 최적화 전략을 HAR 분야에 성공적으로 적용하여 교차 데이터셋 일반화 성능을 향상시켰습니다.
MSE 손실 기반의 마스크 재구성 작업과 Mahony 퓨전 알고리즘 통합을 통해 IMU 센서 데이터의 특성에 효과적으로 대응했습니다.
기존 방법보다 높은 정확도를 달성하면서 데이터 효율성을 크게 향상시켰습니다.
HAR 기술의 실용적인 적용 가능성을 높였습니다.
한계점:
제안된 방법의 성능 향상이 특정 데이터셋 조합에 국한될 가능성이 있습니다. 다양한 데이터셋 조합에 대한 추가적인 실험이 필요합니다.
Mahony 퓨전 알고리즘의 성능에 의존적이며, 알고리즘의 한계가 HAR-DoReMi의 성능에 영향을 줄 수 있습니다.
본 논문에서 사용된 데이터셋의 종류와 특성에 대한 자세한 설명이 부족합니다. 더욱 다양하고 포괄적인 데이터셋에 대한 실험이 필요합니다.
👍