Sign In

NABench: Large-Scale Benchmarks of Nucleotide Foundation Models for Fitness Prediction

Created by
  • Haebom
Category
Empty

저자

Zhongmin Li, Runze Ma, Jiahao Tan, Chengzi Tan, Shuangjia Zheng

개요

NABench는 핵산(DNA/RNA) 서열 변이로 인한 기능적 적합성 변화를 예측하기 위한 대규모 벤치마크입니다. 162개의 고처리량 분석 데이터를 통합하고, 260만 개의 변이 서열을 포함하며, 표준화된 분할과 풍부한 메타데이터를 제공합니다. NABench는 기존 벤치마크보다 규모, 다양성 및 데이터 품질 면에서 우수하며, 29개의 대표적인 모델을 다양한 설정(제로샷, 소수샷 예측, 전이 학습, 지도 학습)에서 평가합니다. 이 연구는 다양한 모델의 강점과 약점을 파악하고, 핵산 모델링 발전을 위한 강력한 기준선을 제시하며, RNA/DNA 설계, 합성 생물학, 생화학 등 다양한 분야의 응용을 지원합니다.

시사점, 한계점

NABench는 핵산 적합성 예측을 위한 대규모, 체계적인 벤치마크를 제공하여 모델 비교 및 평가를 용이하게 합니다.
다양한 모델의 성능을 정량적으로 평가하여, 모델 선택 및 개선 방향을 제시합니다.
제로샷, 소수샷 예측 등 다양한 학습 환경에서 모델 성능을 평가하여, 모델의 일반화 능력을 파악합니다.
핵산 서열 변이 연구의 발전을 촉진하고, 관련 분야의 응용을 지원합니다.
(한계점은 논문에 직접적으로 언급되지 않음)
👍