본 논문은 대규모 언어 모델(LLM) 기반 에이전트인 BioDiscoveryAgent를 소개합니다. BioDiscoveryAgent는 새로운 실험을 설계하고, 결과를 추론하며, 원하는 해결책에 도달하기 위해 가설 공간을 효율적으로 탐색합니다. 특히 유전자 변형 실험 설계 문제에 적용되어, 특정 표현형(예: 세포 성장)을 유발하는 소수의 유전자를 찾는 데 사용됩니다. 기존의 베이지안 최적화 기법과 달리, 머신러닝 모델 훈련이나 획득 함수 설계 없이도 생물학적 지식을 활용하여 새로운 실험을 설계합니다. Claude 3.5 Sonnet을 사용하는 BioDiscoveryAgent는 6개의 데이터 세트에서 관련 유전자 변형 예측을 평균 21% 향상시켰으며, 비필수 유전자 변형이라는 더 어려운 작업에서는 46% 향상되었습니다. 평가에는 LLM의 훈련 데이터에 포함되지 않은 미발표 데이터 세트도 포함됩니다. 또한, 무작위 기준선보다 두 배 이상 정확하게 변형할 유전자 조합을 예측하며, 이는 폐쇄 루프 실험 설계 맥락에서는 아직 탐구되지 않은 작업입니다. BioDiscoveryAgent는 생물 의학 문헌 검색, 생물학적 데이터 세트 분석을 위한 코드 실행, 예측의 비판적 평가를 위한 다른 에이전트 프롬프트 기능을 갖추고 있으며, 모든 단계에서 해석 가능합니다. 따라서 생물학적 실험의 계산 설계에 있어 새로운 접근 방식을 제시하며 과학자의 효율성을 높일 가능성을 지닙니다.