본 논문은 RGB 영상의 한계를 극복하기 위해 이벤트 카메라를 활용한 수어 번역 시스템을 제안한다. 기존 수어 번역 알고리즘은 RGB 프레임에 의존하여 프레임 속도, 조명 변화, 빠른 손짓으로 인한 모션 블러 등의 문제점을 가지고 있다. 이를 해결하기 위해 DVS346 카메라를 이용하여 대규모 RGB-이벤트 수어 번역 데이터셋 VECSL을 구축하였으며, 이는 15,676개의 RGB-이벤트 샘플, 15,191개의 어휘, 2,568개의 중국어 문자를 포함한다. 다양한 환경에서 촬영된 이 데이터셋을 기반으로 기존 최첨단 수어 번역 알고리즘을 재훈련 및 평가하고, 미세 수어와 거시 수어 검색을 통합한 새로운 RGB-이벤트 수어 번역 프레임워크 M$^2$-SLT를 제안하여 최첨단 성능을 달성하였다. 데이터셋과 소스 코드는 공개될 예정이다.