본 논문은 6G의 핵심 구성 요소인 MEC 기반 지상-항공 통합 네트워크(MAGIN)에서의 에너지 최소화 문제를 다룬다. 드론(UAV) 및 고고도 플랫폼 기지국(HAPS)과 같은 항공 기지국(ABS)을 사용하여 지상 IoT 기기(IoTD)에 동적 서비스를 제공하는 시스템에서, 실시간 애플리케이션(멀티미디어, 메타버스 서비스 등)의 높은 연산 자원 요구량과 엄격한 QoS(지연 시간, 작업 대기열 관리) 보장을 위해 IoTD의 제한된 에너지 및 처리 능력을 고려하여 작업 오프로딩을 통한 분산 처리를 수행한다. 본 논문에서는 UAV 궤적, 컴퓨팅 자원 할당 및 대기열 인식 작업 오프로딩 결정을 공동으로 최적화하여 전체 에너지 최소화 문제를 해결한다. 비볼록, 비선형 특성으로 인해 기존 방법이 효과적이지 않은 이 문제를 연속 행동 공간과 이종 에이전트를 가진 다중 에이전트 마르코프 의사 결정 과정(MDP)으로 재구성하고, 베타 분포를 사용하는 다중 에이전트 근접 정책 최적화(MAPPO-BD)의 새로운 변형을 제안하여 해결한다. 광범위한 시뮬레이션을 통해 MAPPO-BD가 기준 계획보다 우수한 에너지 절약 및 효율적인 자원 관리를 달성함을 보여준다.