본 논문은 유전자 발현 데이터에서 질병 관련 유전자를 자동으로 분석하는 데 있어 Large Language Model(LLM) 기반 에이전트의 활용 가능성을 평가하고 개발을 지원하기 위해 GenoTEX라는 벤치마크 데이터셋을 제시합니다. GenoTEX는 데이터셋 선택, 전처리, 통계 분석 등 광범위한 유전자 식별 문제에 대한 주석이 달린 코드와 결과를 제공하며, 전산 유전체학 표준을 준수하는 파이프라인을 포함합니다. 생물정보학자의 전문가 검토를 거쳐 정확성과 신뢰성을 보장합니다. LLM 기반 에이전트인 GenoAgent는 다단계 프로그래밍 워크플로우와 유연한 자가 수정 기능을 사용하여 유전자 발현 데이터셋을 분석합니다. 실험 결과는 LLM 기반 방법의 잠재력을 보여주지만, 오류 분석은 향후 개선이 필요한 부분을 보여줍니다. GenoTEX는 유전자 발현 데이터 분석을 위한 자동화된 방법의 벤치마킹과 향상에 유용한 자원이 될 것으로 기대됩니다.