본 연구는 단백질 데이터 뱅크(PDB)에서 추출한 단백질 서열의 기능 그룹 분류를 위한 딥러닝 기반 프레임워크를 제시한다. CNN, BiLSTM, CNN-BiLSTM 하이브리드, 어텐션이 포함된 CNN 등 4가지 아키텍처를 구현하고, k-mer 정수 인코딩을 사용하여 로컬 및 장거리 종속성을 모두 포착했다. CNN 모델이 91.8%의 최고 검증 정확도를 달성하여 국소 모티프 감지의 효과를 입증했다. Grad-CAM 및 통합 그라디언트를 포함한 설명 가능한 AI 기술을 적용하여 모델 예측을 해석하고 생물학적으로 의미 있는 서열 모티프를 식별했다. 발견된 모티프는 히스티딘, 아스파르트산, 글루탐산, 라이신에 풍부하며, 이는 전이효소의 촉매 및 금속 결합 영역에서 흔히 발견되는 아미노산 잔기를 나타낸다.