본 논문은 AlphaFold2와 ESMFold와 같은 단백질 구조 예측 모델(PPM)의 확장성 한계를 극복하기 위해 하드웨어-소프트웨어 공동 설계 가속기인 LightNobel을 제시합니다. 긴 아미노산 서열을 가진 단백질 처리 시 발생하는 계산 및 메모리 부담을 해결하기 위해, 소프트웨어적으로는 토큰별 적응형 활성화 양자화(AAQ) 기법을, 하드웨어적으로는 다중 정밀도 재구성 가능 행렬 처리 장치(RMPU)와 다용도 벡터 처리 장치(VVPU)를 통합했습니다. LightNobel은 NVIDIA A100 및 H100 GPU 대비 최대 8.44배 및 8.41배의 속도 향상과 37.29배 및 43.35배의 높은 전력 효율을 달성하며, 정확도 손실은 무시할 만한 수준입니다. 또한, PPM에서 최대 120.05배의 피크 메모리 요구량 감소를 통해 긴 서열의 단백질 처리를 가능하게 합니다.