본 논문은 분산 컴퓨팅 연속 시스템(DCCS)과 같은 대규모 아키텍처에서 서비스 수준 목표(SLO)를 보장하는 데 있어, 이기종적 특성과 다양한 디바이스 및 애플리케이션에 따른 서비스 요구사항의 차이, 예측 불가능한 작업량 및 자원 제약으로 인한 성능 변동 및 SLO 위반 문제를 다룹니다. 이를 해결하기 위해 머신러닝, 특히 액티브 추론(Active Inference)을 활용하여 DCCS의 SLO 준수를 향상시키는 방법을 제시합니다. 실제 DCCS 사용 사례인 에지 디바이스에서 비디오 컨퍼런싱 애플리케이션과 비디오 스트리밍 WebSocket 서버를 동시에 실행하는 시나리오를 고려하여, Deep Q-Network, Advantage Actor-Critic, Proximal Policy Optimization 등 세 가지 강화 학습 알고리즘과 액티브 추론을 비교 평가합니다. 지연 시간, 대역폭 사용량 등의 주요 성능 지표를 지속적으로 모니터링하여 스트림 수, 프레임 속도, 해상도 등의 매개변수를 동적으로 조정하여 서비스 품질과 사용자 경험을 최적화합니다. 동적으로 변하는 SLO와 네트워크 대역폭 제한, 디바이스 열 상태 변동 등의 갑작스러운 및 점진적인 데이터 변화 시나리오를 시뮬레이션하여 알고리즘의 적응성을 테스트합니다. 결과적으로, 평가된 모든 알고리즘은 장단점을 보였지만, 액티브 추론은 낮은 메모리 사용량, 안정적인 CPU 사용률, 빠른 수렴 속도를 제공하는 등 DCCS에서 SLO 준수를 보장하는 유망한 접근 방식임을 보여줍니다.