본 논문은 여러 대의 Micro-Aerial Vehicle (MAV) 팀을 사용하여 케이블에 매달린 물체의 실제 6-자유도(6-DoF) 조작을 가능하게 하는 최초의 분산 방식을 제시합니다. 본 연구는 각 MAV에 대한 외곽 루프 제어 정책을 훈련하기 위해 다중 에이전트 강화 학습(MARL)을 활용합니다. 중앙 집중식 방식을 사용하는 최첨단 컨트롤러와 달리, 본 정책은 전역 상태, MAV 간 통신 또는 인접 MAV 정보를 필요로 하지 않습니다. 대신, 에이전트는 부하 자세 관측만을 통해 암묵적으로 통신하며, 이는 높은 확장성과 유연성을 가능하게 합니다. 또한 추론 시간 동안 컴퓨팅 비용을 크게 줄여 정책의 온보드 배포를 가능하게 합니다. 또한, 선형 가속도와 바디 레이트를 사용하여 MAV를 위한 새로운 액션 공간 설계를 도입했습니다. 이러한 선택은 견고한 로우 레벨 컨트롤러와 결합되어 동적 3D 움직임 동안 케이블 장력으로 인한 상당한 불확실성에도 불구하고 신뢰할 수 있는 sim-to-real 전송을 가능하게 합니다. 부하 모델 불확실성 하에서 완전 자세 제어를 포함한 다양한 실제 실험에서 본 연구의 방법을 검증했으며, 최첨단 중앙 집중식 방법과 유사한 설정점 추적 성능을 보여주었습니다. 또한, 이질적인 제어 정책을 가진 에이전트 간의 협력과 한 대의 MAV의 완전한 비행 중 손실에 대한 강건성을 시연했습니다.