Hierarchical Adaptive networks with Task vectors for Test-Time Adaptation
Created by
Haebom
Category
Empty
저자
Sameer Ambekar, Marta Hasny, Laura Daza, Daniel M. Lang, Julia A. Schnabel
💡 개요
본 연구는 사전 학습된 모델이 수신 데이터 스트림에 적응하여 소스 도메인과 타겟 도메인 간의 분포 변화에 대처하는 테스트 시간 적응(TTA) 기법의 한계를 극복하고자 합니다. 기존의 단일 차원 선형 분류 계층에 의존하는 방식은 복잡하고 다양한 분포 변화를 처리하는 데 어려움이 있기에, 본 논문은 계층적으로 구성된 다양한 크기의 계층을 활용하는 Hi-Vec (Hierarchical Adaptive networks with Task Vectors)이라는 새로운 TTA 방법을 제안합니다. Hi-Vec은 이러한 계층적 구조를 통해 기존 방법을 플러그 앤 플레이 방식으로 적용 가능하게 하여 다양한 복잡도의 분포 변화에 적응할 수 있도록 합니다.
🔑 시사점 및 한계
•
동적 계층 선택: 각 테스트 배치에 대한 최적의 적응 계층을 자동으로 식별하는 메커니즘을 제안하여 적응 효율성을 높입니다.
•
타겟 정보 전파: 동적 계층에서 추출된 가중치를 다른 계층으로 병합하는 메커니즘을 통해 모든 계층이 타겟 데이터 정보를 공유하도록 하여 전반적인 적응 성능을 강화합니다.
•
오류 방지 메커니즘: 선형 계층 합의(linear layer agreement)를 게이팅 함수로 사용하여 노이즈가 포함된 배치에서의 부정확한 미세 조정을 방지합니다.
•
한계점: 제안된 Hi-Vec이 기존 방법론을 개선하지만, 추가적인 계산 복잡성이나 특정 유형의 분포 변화에 대한 적응 성능 저하 가능성은 더 많은 연구가 필요할 수 있습니다. 또한, 제안된 계층 구조의 최적화 및 다양한 모델 아키텍처에 대한 일반화 성능 검증이 추가적으로 이루어져야 할 것입니다.