본 논문은 제한된 메모리, 연산능력, 에너지를 가진 임베디드 기기 내에 머신러닝(ML)을 통합하는 TinyML 분야에 초점을 맞추고 있다. 특히 센서에 직접 ML을 통합하여 임베디드 기기의 전력 소모를 줄이는 새로운 TinyML 연구에 대해 다룬다. 기존 연구들이 센서 내에서 직접 작동하는 Convolutional Neural Networks (CNNs)의 최적화된 구현에 초점을 맞추지 않은 점을 지적하며, STMicroelectronics의 관성 측정 장치(IMU) 내 Intelligent Sensor Processing Unit (ISPU)에서 동작하는 Depth-First CNN의 최적화된 설계 및 구현을 처음으로 제시한다. 본 논문의 접근 방식은 CNN을 ISPU와 마이크로컨트롤러(MCU) 간에 분할하고, 결과에 대한 충분한 확신이 얻어지면 IMU의 계산을 중지하는 조기 종료(Early-Exit) 메커니즘을 사용하여 전력 소모를 크게 줄인다. NUCLEO-F411RE 보드를 사용한 결과, 평균 전류 소모량이 4.8mA로 MCU에서의 일반적인 추론 파이프라인에 비해 11% 감소하면서 동일한 정확도를 달성했다.