본 연구는 낙농가와 같은 농촌 지역에서 재생 에너지 자원을 통합하여 P2P 에너지 거래를 통해 분산 에너지 관리를 가능하게 하는 연구를 제시한다. 동적 환경에서 어려움을 겪는 기존 규칙 기반 방법의 한계를 해결하기 위해, Multi-Agent Reinforcement Learning(MARL)인 Proximal Policy Optimization(PPO) 및 Deep Q-Networks(DQN)을 경매 기반 시장 청산, 가격 자문 에이전트, 부하 및 배터리 관리를 통합한 P2P 거래 메커니즘과 결합했다. DQN은 아일랜드에서 14.2%, 핀란드에서 5.16%의 전기 비용 감소를 달성하고, PPO는 아일랜드에서 최고 시간대 수요를 55.5% 감소시켰다.