본 논문은 공학적으로 설계된 생물학적 에이전트를 이용한 조직 재생 과정 최적화를 위한 다중 에이전트 강화 학습(MARL) 프레임워크를 제시합니다. 이 접근 방식은 (1) 분자 신호 전달을 모델링하는 확률적 반응-확산 시스템, (2) Hebbian 가소성을 갖춘 신경 유사 전기화학적 통신, 그리고 (3) 화학적 기울기 추적, 신경 동기화 및 강력한 패널티를 결합한 생물학적으로 고안된 보상 함수를 통합합니다. 교과 과정 학습 계획은 에이전트가 점진적으로 복잡해지는 수리 시나리오를 안내합니다. 컴퓨터 시뮬레이션 실험은 동적 분비 제어 및 공간 조정을 포함한 새로운 수리 전략을 보여줍니다.