단백질 언어 모델(PLM)은 다양한 예측 작업에 강력한 서열 표현을 생성하는 능력을 통해 계산 생물학에 혁명을 일으켰습니다. 그러나 블랙박스 특성으로 인해 생물학적 해석과 실행 가능한 통찰력으로의 변환이 제한됩니다. 본 논문에서는 PLM 임베딩을 기존 생화학적 특징을 기반으로 하는 해석 가능한 부분 공간과 모델의 예측력을 유지하는 잔차 부분 공간의 두 구성 요소로 분해하는 설명 가능한 어댑터 계층인 PLM-eXplain(PLM-X)을 제시합니다. ESM2의 임베딩을 사용하여 당사의 어댑터는 이차 구조 및 소수성을 포함한 잘 확립된 특성을 통합하면서 높은 성능을 유지합니다. 세 가지 단백질 수준 분류 작업(세포 외 소포 연관성 예측, 막 헬릭스 식별, 응집 경향 예측)에서 당사 접근 방식의 효과를 보여줍니다. PLM-X는 정확성을 희생하지 않고 모델 결정의 생물학적 해석을 가능하게 하여 다양한 다운스트림 응용 프로그램에서 PLM 해석력을 향상시키는 일반적인 솔루션을 제공합니다. 이 연구는 강력한 심층 학습 모델과 실행 가능한 생물학적 통찰력 사이의 가교를 제공함으로써 계산 생물학의 중요한 요구 사항을 해결합니다.