DGFamba: Learning Flow Factorized State Space for Visual Domain Generalization
Created by
Haebom
저자
Qi Bi, Jingjun Yi, Hao Zheng, Haolan Zhan, Wei Ji, Yawen Huang, Yuexiang Li
개요
본 논문은 시각적 도메인 일반화를 위한 새로운 모델인 DG-Famba를 제안합니다. 시각적 도메인 일반화의 주요 과제는 이미지 내용은 유지되면서 스타일 변화가 심한 도메인 간 차이입니다. 본 논문에서는 VMamba와 같은 선택적 상태 공간의 장점(전역 수용 영역을 통한 내용 표현)을 활용하여, 스타일 증강된 상태 임베딩과 원본 상태 임베딩을 흐름 분해(flow factorization)를 통해 매핑하는 방법을 제시합니다. 이를 통해 잠재 공간에서 각 스타일의 상태 임베딩을 잠재 확률 경로로 표현하고, 이 경로들을 정렬하여 스타일 차이에 관계없이 동일한 내용 분포를 나타낼 수 있도록 합니다. 다양한 시각적 도메인 일반화 설정에서의 실험을 통해 최첨단 성능을 보임을 확인했습니다.
시사점, 한계점
•
시사점:
◦
흐름 분해를 이용한 선택적 상태 공간 모델이 시각적 도메인 일반화 문제에 효과적임을 보여줌.
◦
스타일 변화에 강인한 도메인 불변 특징 표현 방법 제시.
◦
다양한 시각적 도메인 일반화 설정에서 최첨단 성능 달성.
•
한계점:
◦
제안된 모델의 계산 복잡도에 대한 분석이 부족함.
◦
특정 유형의 스타일 변화에 대해서만 효과적일 가능성 존재. 다양한 스타일 변화에 대한 일반화 성능 평가 추가 필요.