본 논문은 일반 인공지능 분야의 파운데이션 모델의 성공을 생물학 분야로 확장하려는 기존 연구의 한계를 지적하고, 생물학적 데이터의 고유한 특성을 고려한 새로운 프레임워크인 BioArc를 제안합니다. BioArc는 Neural Architecture Search (NAS)를 활용하여 생물학적 파운데이션 모델을 위한 최적의 아키텍처를 자동적으로 탐색하고, 아키텍처, 토큰화, 훈련 전략 간의 상호 작용을 분석합니다. 이를 통해 새로운 고성능 아키텍처를 발굴하고, 미래 모델 개발을 위한 설계 원칙을 제시합니다. 또한, 발견된 아키텍처를 활용하기 위해 새로운 생물학적 과제에 적합한 최적의 아키텍처를 효과적으로 예측하는 방법을 제안합니다.