Rethinking Text-based Protein Understanding: Retrieval or LLM?
Created by
Haebom
Category
Empty
저자
Juntong Wu, Zijing Liu, He Cao, Hao Li, Bin Feng, Zishan Shu, Ke Yu, Li Yuan, Yu Li
개요
단백질 생성 및 이해 분야에서 단백질-텍스트 모델의 잠재력에 대한 연구. 기존 연구의 데이터 유출 문제와 NLP 기반 평가의 한계를 지적하고, 이를 해결하기 위해 데이터셋을 재구성하고 생물학적 엔티티 기반의 새로운 평가 프레임워크를 제시함. 또한, 검색 기반 방법을 제안하여 단백질-텍스트 생성에서 기존 LLM보다 우수한 성능을 보임.