PSBench: a large-scale benchmark for estimating the accuracy of protein complex structural models
Created by
Haebom
저자
Pawan Neupane, Jian Liu, Jianlin Cheng
개요
본 논문은 단백질 복합체 구조 예측 모델의 정확도를 신뢰성 있게 평가하는 방법(EMA, Estimation of Model Accuracy) 개발의 어려움을 해결하기 위해, CASP15 및 CASP16에서 생성된 100만 개 이상의 구조 모델을 포함하는 대규모 벤치마크 데이터셋 PSBench를 제시합니다. PSBench는 다양한 단백질 서열 길이, 복합체 화학량론, 기능적 분류 및 모델링 난이도를 포함하며, 각 모델은 전역, 지역 및 인터페이스 수준에서 여러 보완적인 품질 점수로 주석이 달려 있습니다. 논문에서는 PSBench의 유용성을 보여주기 위해, 그래프 변환기 기반 EMA 방법인 GATE를 CASP15 데이터로 학습시키고 CASP16에서 블라인드 테스트하여 상위 성능을 보였음을 제시합니다. PSBench는 https://github.com/BioinfoMachineLearning/PSBench 에서 공개적으로 이용 가능합니다.