본 논문은 실제 세계의 복잡하고 현실적인 작업에서 추론 과제가 존재하는 (예: 다단계 추론과 모호한 요구 사항을 포함하는 장기간 조작) 복잡한 스프레드시트 조작을 위한 대규모 언어 모델(LLM)의 활용을 연구합니다. 기존 연구의 한계를 극복하기 위해, 장기간 및 다중 범주 작업을 특징으로 하며 실생활의 어려움으로 인한 추론 의존적 조작이 포함된 SheetRM이라는 벤치마크를 제시합니다. 또한 LLM의 기능을 활용하는 새로운 자율 에이전트인 SheetAgent를 제안합니다. SheetAgent는 계획자, 정보 제공자, 검색자의 세 가지 모듈로 구성되어 반복적인 작업 추론 및 반성을 통해 인간의 상호 작용 없이 고급 추론과 정확한 스프레드시트 조작을 달성합니다. 실험 결과, SheetAgent는 여러 벤치마크에서 기준선보다 20~40%의 통과율 향상을 보이며, 스프레드시트 조작의 정확성을 높이고 우수한 표 추론 능력을 보여줍니다. 프로젝트 웹사이트(https://sheetagent.github.io/), 데이터셋 및 소스 코드(https://anonymous.4open.science/r/SheetAgent)를 공개합니다.