Genie-CAT은 단백질 디자인에서 과학적 가설 생성을 가속화하기 위해 개발된 도구 기반 대규모 언어 모델(LLM) 시스템입니다. 금속 단백질(예: 페레독신)을 사례 연구로 사용하여, 문헌 기반 추론(RAG), 단백질 데이터 뱅크 파일의 구조적 파싱, 정전기적 전위 계산, 산화환원 특성의 기계 학습 예측의 네 가지 기능을 통합합니다. 자연어 추론과 데이터 기반 및 물리 기반 계산을 결합하여 서열, 구조 및 기능 간의 기계론적으로 해석 가능하고 테스트 가능한 가설을 생성합니다. Genie-CAT은 [Fe--S] 클러스터 근처의 잔기 수준 변형을 자율적으로 식별하여 산화환원 조절에 영향을 미치며, 전문가가 도출한 가설을 짧은 시간에 재현합니다.