Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

DGFamba: Learning Flow Factorized State Space for Visual Domain Generalization

Created by
  • Haebom

저자

Qi Bi, Jingjun Yi, Hao Zheng, Haolan Zhan, Wei Ji, Yawen Huang, Yuexiang Li

개요

본 논문은 시각적 도메인 일반화를 위한 새로운 모델인 DG-Famba를 제안합니다. 시각적 도메인 일반화의 주요 과제는 이미지 내용은 유지되면서 스타일 변화가 심한 도메인 간 차이입니다. 본 논문에서는 VMamba와 같은 선택적 상태 공간의 장점(전역 수용 영역을 통한 내용 표현)을 활용하여, 스타일 증강된 상태 임베딩과 원본 상태 임베딩을 흐름 분해(flow factorization)를 통해 매핑하는 방법을 제시합니다. 이를 통해 잠재 공간에서 각 스타일의 상태 임베딩을 잠재 확률 경로로 표현하고, 이 경로들을 정렬하여 스타일 차이에 관계없이 동일한 내용 분포를 나타낼 수 있도록 합니다. 다양한 시각적 도메인 일반화 설정에서의 실험을 통해 최첨단 성능을 보임을 확인했습니다.

시사점, 한계점

시사점:
흐름 분해를 이용한 선택적 상태 공간 모델이 시각적 도메인 일반화 문제에 효과적임을 보여줌.
스타일 변화에 강인한 도메인 불변 특징 표현 방법 제시.
다양한 시각적 도메인 일반화 설정에서 최첨단 성능 달성.
한계점:
제안된 모델의 계산 복잡도에 대한 분석이 부족함.
특정 유형의 스타일 변화에 대해서만 효과적일 가능성 존재. 다양한 스타일 변화에 대한 일반화 성능 평가 추가 필요.
실제 응용 분야에서의 성능 검증이 부족함.
👍