MMEdge는 자율 주행, 인간-컴퓨터 상호작용, 모바일 헬스와 같은 애플리케이션을 위해 리소스가 제한된 엣지 장치에서 실시간 멀티모달 추론을 수행하는 새로운 온-디바이스 프레임워크입니다. 파이프라인 센싱 및 인코딩을 기반으로 하는 MMEdge는 완전한 센서 입력을 기다리는 대신, 전체 추론 프로세스를 세분화된 센싱 및 인코딩 유닛 시퀀스로 분해하여 데이터가 도착하는 대로 점진적으로 계산을 진행할 수 있도록 합니다. MMEdge는 또한 정확도 유지를 위해 다양한 파이프라인 유닛에서 풍부한 시간적 동역학을 포착하는 경량의 효과적인 시간적 집계 모듈을 도입합니다. 또한, MMEdge는 지연 시간 제약 조건 하에서 각 모달리티에 대한 최적의 센싱 및 모델 구성을 동적으로 선택하는 적응형 멀티모달 구성 최적화 장치와, 조기 예측이 충분한 신뢰도에 도달했을 때 느린 모달리티의 향후 유닛을 우회하는 교차 모달 스페큘레이티브 스키핑 메커니즘을 통합합니다. MMEdge는 공개 멀티모달 데이터 세트 2개와 실제 무인 항공기(UAV) 기반 멀티모달 테스트베드에 배포되었으며, 다양한 시스템 및 데이터 동역학에서 높은 작업 정확도를 유지하면서 엔드 투 엔드 지연 시간을 크게 줄이는 결과를 보였습니다.