Sign In

Benchmarking Dynamic SLO Compliance in Distributed Computing Continuum Systems

Created by
  • Haebom
Category
Empty

저자

Alfreds Lapkovskis, Boris Sedlak, Sindri Magnusson, Schahram Dustdar, Praveen Kumar Donta

개요

본 논문은 분산 컴퓨팅 연속 시스템(DCCS)과 같은 대규모 아키텍처에서 서비스 수준 목표(SLO)를 보장하는 데 있어, 이기종적 특성과 다양한 디바이스 및 애플리케이션에 따른 서비스 요구사항의 차이, 예측 불가능한 작업량 및 자원 제약으로 인한 성능 변동 및 SLO 위반 문제를 다룹니다. 이를 해결하기 위해 머신러닝, 특히 액티브 추론(Active Inference)을 활용하여 DCCS의 SLO 준수를 향상시키는 방법을 제시합니다. 실제 DCCS 사용 사례인 에지 디바이스에서 비디오 컨퍼런싱 애플리케이션과 비디오 스트리밍 WebSocket 서버를 동시에 실행하는 시나리오를 고려하여, Deep Q-Network, Advantage Actor-Critic, Proximal Policy Optimization 등 세 가지 강화 학습 알고리즘과 액티브 추론을 비교 평가합니다. 지연 시간, 대역폭 사용량 등의 주요 성능 지표를 지속적으로 모니터링하여 스트림 수, 프레임 속도, 해상도 등의 매개변수를 동적으로 조정하여 서비스 품질과 사용자 경험을 최적화합니다. 동적으로 변하는 SLO와 네트워크 대역폭 제한, 디바이스 열 상태 변동 등의 갑작스러운 및 점진적인 데이터 변화 시나리오를 시뮬레이션하여 알고리즘의 적응성을 테스트합니다. 결과적으로, 평가된 모든 알고리즘은 장단점을 보였지만, 액티브 추론은 낮은 메모리 사용량, 안정적인 CPU 사용률, 빠른 수렴 속도를 제공하는 등 DCCS에서 SLO 준수를 보장하는 유망한 접근 방식임을 보여줍니다.

시사점, 한계점

시사점:
액티브 추론이 DCCS 환경에서 SLO 준수를 위한 효과적인 머신러닝 기법임을 제시.
액티브 추론의 낮은 메모리 사용량, 안정적인 CPU 사용률, 빠른 수렴 속도를 실험적으로 확인.
동적 SLO 변화 및 데이터 변화 시나리오에 대한 알고리즘의 적응성 평가를 통해 실제 시스템 적용 가능성을 높임.
다양한 강화학습 알고리즘과의 비교 분석을 통해 액티브 추론의 장점을 명확히 제시.
한계점:
제한된 실험 환경 (특정 DCCS 사용 사례 및 알고리즘에 국한).
더욱 다양하고 복잡한 DCCS 환경에서의 일반화 가능성에 대한 추가 연구 필요.
액티브 추론의 하이퍼파라미터 최적화 및 튜닝에 대한 자세한 설명 부족.
실제 시스템 배포 및 장기간 운영 시 발생할 수 있는 문제점에 대한 고려 부족.
👍