본 논문은 클라우드 기반 심층 신경망 추론의 지연 응답 시간, 확장성 제한 및 개인 정보 보호 문제를 해결하기 위한 핵심 해결책으로 에지 추론(EI)을 제시합니다. 하지만 자원 제약이 있는 에지 디바이스에 DNN 모델을 배포하는 것은 모델 저장 용량 제한, 동적 서비스 요청 및 개인 정보 보호 위험과 같은 더 심각한 문제에 직면합니다. 이 논문은 자원 및 개인 정보 보호 제약 조건 하에서 장기 평균 추론 지연을 최소화하기 위해 개인 정보 보호를 고려한 DNN 모델 배포 및 분할 최적화를 위한 새로운 프레임워크를 제안합니다. 모델 배포, 사용자-서버 연결 및 모델 분할 전략을 고려한 복잡한 최적화 문제로 공식화하고, NP-hard 문제와 미래의 불확실성을 처리하기 위해 Lyapunov 기반 접근 방식을 도입하여 장기 최적화 문제를 단일 시간 슬롯 문제로 변환하여 시스템 성능을 보장합니다. 또한, 에지 서버 연결을 위한 연합 형성 게임 모델과 각 연합 내에서 모델 배포를 위한 탐욕적 알고리즘을 개발하여 문제를 효율적으로 해결합니다. 광범위한 시뮬레이션을 통해 제안된 알고리즘이 다양한 시나리오에서 기준 접근 방식보다 우수한 성능을 보이며 개인 정보 보호 제약 조건을 만족하면서 추론 지연을 효과적으로 줄이는 것을 보여줍니다.