본 논문은 유전자 발현 데이터로부터 질병 관련 유전자를 자동으로 분석하는 과정을 지원하기 위해 GenoTEX라는 벤치마크 데이터셋을 제시한다. GenoTEX는 데이터셋 선택, 전처리, 통계 분석 등 다양한 유전자-형질 연관성 문제 해결을 위한 분석 코드와 결과를 제공하며, 생물정보학 전문가의 검토를 거쳐 정확성과 신뢰성을 확보했다. 또한, 다단계 프로그래밍 워크플로우와 자가 수정 기능을 통해 유전자 발현 데이터를 분석하는 LLM 기반 에이전트인 GenoAgent를 소개하고, 이를 통해 LLM 기반 방법의 잠재력과 개선점을 보여준다. GenoTEX는 유전자 발현 데이터 분석 자동화 방법의 벤치마킹 및 개선을 위한 유용한 자원으로 제시된다.