대규모 언어 모델(LLM)과 에이전트 프레임워크가 단일 세포 생물학 분야를 변화시키고 있지만, 데이터 양식, 아키텍처, 평가 기준이 분산되어 있다. LLM4Cell은 RNA, ATAC, 다중 오믹스, 공간 양식을 아우르는 단일 세포 연구를 위해 개발된 58개의 파운데이션 모델과 에이전트 모델에 대한 최초의 통합 조사이다. 이 모델들을 파운데이션, 텍스트 브릿지, 공간, 다중 모달, 후성 유전체, 에이전트의 5가지 범주로 분류하고, 주석, 궤적 및 교란 모델링, 약물 반응 예측 등 8가지 주요 분석 작업에 매핑한다. 40개 이상의 공개 데이터 세트를 활용하여 벤치마크 적합성, 데이터 다양성, 윤리적 또는 확장성 제약 조건을 분석하고, 생물학적 근거, 다중 오믹스 정렬, 공정성, 개인 정보 보호 및 설명 가능성을 포함하는 10가지 도메인 차원에서 모델을 평가한다. LLM4Cell은 데이터 세트, 모델 및 평가 도메인을 연결하여 언어 기반 단일 세포 지능에 대한 최초의 통합적 관점을 제공하고 해석 가능성, 표준화 및 신뢰할 수 있는 모델 개발에 대한 열린 과제를 제시한다.