# Protein Large Language Models: A Comprehensive Survey

### 저자

Yijia Xiao, Wanjia Zhao, Junkai Zhang, Yiqiao Jin, Han Zhang, Zhicheng Ren, Renliang Sun, Haixin Wang, Guancheng Wan, Pan Lu, Xiao Luo, Yu Zhang, James Zou, Yizhou Sun, Wei Wang

### 개요

본 논문은 100편 이상의 논문을 체계적으로 분석하여 단백질 특이적 거대 언어 모델(Protein LLMs)에 대한 최초의 포괄적인 개요를 제공합니다.  Protein LLMs의 아키텍처, 훈련 데이터셋, 평가 지표 및 다양한 응용 분야를 다루며, 대규모 단백질 서열 데이터를 활용하여 정확도를 향상시키는 방법을 분석하고 단백질 공학 및 생의학 연구 발전에 대한 잠재력을 탐구합니다. 또한 주요 과제와 미래 방향을 논의하며, Protein LLMs를 단백질 과학 분야의 과학적 발견을 위한 필수 도구로 제시합니다.  GitHub([https://github.com/Yijia-Xiao/Protein-LLM-Survey)에](https://github.com/Yijia-Xiao/Protein-LLM-Survey)%EC%97%90) 관련 자료가 유지 관리됩니다.

### 시사점, 한계점

- **시사점:**

    - Protein LLMs에 대한 최초의 포괄적인 조사 및 분류 제공.

    - Protein LLMs의 아키텍처, 데이터, 평가 지표, 응용 분야에 대한 체계적인 분석 제시.

    - 단백질 공학 및 생의학 연구에 대한 Protein LLMs의 잠재적 응용 가능성 제시.

    - 단백질 과학 분야에서 Protein LLMs의 중요성 강조.

- **한계점:**

    - 본 논문에서 제시된 한계점은 명시적으로 언급되지 않았으나,  향후 연구를 위한 과제로 언급된 내용들이 한계점으로 간주될 수 있습니다.  (예: 특정 아키텍처나 응용 분야에 대한 추가 연구 필요성 등)

[PDF 보기](https://arxiv.org/pdf/2502.17504)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).