Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

FaSDiff: Balancing Perception and Semantics in Face Compression via Stable Diffusion Priors

Created by
  • Haebom
Category
Empty

저자

Yimin Zhou, Yichong Xia, Bin Chen, Mingyao Hong, Jiawei Li, Zhi Wang, Yaowei Wang

개요

본 논문은 다양한 어플리케이션에서 안면 이미지 데이터의 사용이 증가함에 따라, 저장 및 전송을 위한 효율적인 안면 의미 기반 압축의 중요성을 강조한다. 기존의 딥러닝 기반 안면 이미지 압축 방법의 낮은 비트율에서의 품질 저하 문제를 해결하기 위해, 본 연구는 시각적 충실도와 의미적 일관성을 향상시키기 위한 새로운 확산 모델 기반 압축 프레임워크인 FaSDiff (Facial Image Compression with a Stable Diffusion Prior)를 제안한다. FaSDiff는 세밀한 디테일을 포착하고 확산 모델을 안내하는 시각적 프롬프트를 생성하기 위해 고주파수 민감 압축기를 사용하고, 저주파수 저하를 해결하기 위해 의미 구조를 분리하고 보존하는 하이브리드 저주파수 향상 모듈을 도입한다. 이러한 방법을 통해 FaSDiff는 인간 시각적 충실도와 기계 시각 정확도 간의 균형을 효과적으로 유지하며, 실험을 통해 기존 방법들보다 우수한 성능을 입증했다.

시사점, 한계점

시사점:
시각적 충실도와 의미적 일관성을 동시에 향상시키는 확산 모델 기반 안면 이미지 압축 프레임워크 제안.
고주파수 디테일 보존을 위한 고주파수 민감 압축기 및 하이브리드 저주파수 향상 모듈 도입.
인간 시각적 충실도와 기계 시각 정확도 간의 균형 달성.
기존 방법 대비 우수한 성능 입증.
한계점:
논문에 제시된 한계점은 명시되지 않음.
👍