Sign In

Enabling Vibration-Based Gesture Recognition on Everyday Furniture via Energy-Efficient FPGA Implementation of 1D Convolutional Networks

Created by
  • Haebom
Category
Empty

저자

Koki Shibata, Tianheng Ling, Chao Qian, Tomokazu Matsui, Hirohiko Suwa, Keiichi Yasumoto, Gregor Schiele

개요

본 연구는 진동 기반 제스처 인식을 위한 에너지 효율적인 솔루션을 제안합니다. 복잡한 전처리 과정과 고성능 하드웨어를 필요로 하는 기존 연구의 한계를 극복하기 위해, 소형 신경망(NN)을 저전력 FPGA에 탑재하여 실시간 제스처 인식을 구현합니다. 구체적으로, (1) 복잡한 스펙트럼 전처리를 생략하고 원시 파형 입력을 사용하여 입력 크기를 21배 줄였습니다. (2) 임베디드 FPGA에 적합한 1D-CNN 및 1D-SepCNN 아키텍처를 설계하여 파라미터 수를 3억 6천 9백만에서 216개로 줄였습니다. (3) 정수 기반 양자화 및 자동 RTL 생성을 통해 FPGA 배포를 용이하게 하였고, 핑퐁 버퍼링 메커니즘을 통해 메모리 제약 하에서도 배포 가능성을 높였습니다. (4) 하드웨어 인식 검색 프레임워크를 확장하여 정확도, 배포 가능성, 지연 시간, 에너지 소비를 고려한 제약 조건 기반 모델 구성을 선택했습니다. AMD Spartan-7 XC7S25 FPGA에서 낮은 지연 시간과 에너지 효율적인 추론을 달성했으며, PS 데이터 분할 설정에서 6-bit 1D-CNN은 평균 0.970의 정확도로 9.22ms의 지연 시간을, 8-bit 1D-SepCNN은 0.949의 정확도로 6.83ms의 지연 시간(CPU 대비 53배 이상 속도 향상)을 기록했습니다. 두 모델 모두 1.2 mJ 미만의 에너지를 소비하여 장기간의 엣지 운영에 적합함을 입증했습니다.

시사점, 한계점

시사점:
에너지 효율적인 진동 기반 제스처 인식을 위한 실용적인 솔루션 제시
FPGA 기반의 저전력, 실시간 제스처 인식 구현
복잡한 전처리 과정 및 대규모 NN의 한계 극복
경량화된 NN 아키텍처 설계 (1D-CNN, 1D-SepCNN)
하드웨어 인식 검색 프레임워크를 통한 최적의 모델 구성 선택
낮은 지연 시간과 에너지 소비량 달성
한계점:
특정 FPGA 하드웨어(AMD Spartan-7 XC7S25)에 대한 의존성
단 두 개의 swipe-direction 데이터셋에 대한 평가
일반적인 테이블 환경에 대한 제한적인 실험 환경
사용자 수에 따른 성능 변화에 대한 추가적인 분석 필요
👍