LLM 기반 에이전트, 특히 ReAct 또는 인간 중심 역할극과 같은 일반적인 프레임워크를 사용하는 에이전트는 엄격하게 구조화된 워크플로우가 필요한 전문 분야에서 어려움을 겪습니다. 원격 감지와 같이 특수 도구(예: 보정, 스펙트럼 지수 계산) 및 다단계 절차(예: 수많은 중간 산출물 및 선택적 단계)가 필요한 분야는 일반화된 접근 방식에 큰 어려움을 줍니다. 이 간극을 해결하기 위해, 계층적 작업 추상화 메커니즘(HTAM)을 중심으로 하는 새로운 에이전트 설계 프레임워크를 소개합니다. HTAM은 사회적 역할을 모방하는 것을 넘어, 특정 도메인의 내재적 작업 종속성 그래프를 반영하는 논리적 계층 구조로 다중 에이전트 시스템을 구성합니다. 이러한 작업 중심 아키텍처는 절차적 정확성을 보장하고 복잡한 문제를 순차적인 계층으로 분해하며, 각 계층의 하위 에이전트는 이전 계층의 출력을 기반으로 작동합니다. 이 프레임워크를 복잡한 지리 공간 분석을 위해 설계된 다중 에이전트 시스템인 EarthAgent로 구현했습니다. 이러한 복잡한 계획 능력을 평가하기 위해, 현실적인 다단계 지리 공간 계획 작업의 포괄적인 벤치마크인 GeoPlan-bench를 구축했습니다. GeoPlan-bench는 도구 선택, 경로 유사성 및 논리적 완전성을 평가하기 위한 정교하게 설계된 일련의 메트릭과 함께 제공됩니다. 실험 결과 EarthAgent가 기존의 다양한 단일 및 다중 에이전트 시스템보다 성능이 훨씬 뛰어났습니다. 본 연구는 에이전트 아키텍처를 도메인의 내재적 작업 구조에 맞추는 것이 견고하고 신뢰할 수 있는 전문 자율 시스템을 구축하는 데 중요한 단계임을 보여줍니다.