Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Hyperbolic Safety-Aware Vision-Language Models

Created by
  • Haebom
Category
Empty

저자

Tobia Poppi, Tejaswi Kasarla, Pascal Mettes, Lorenzo Baraldi, Rita Cucchiara

개요

본 논문은 CLIP과 같은 비전-언어 모델에서 안전하지 않은 콘텐츠 검색 문제를 해결하기 위해 기존의 unlearning 방식 대신, hyperbolic space의 계층적 특성을 활용한 'awareness' 패러다임을 제시합니다. 안전한 콘텐츠와 안전하지 않은 콘텐츠를 hyperbolic space의 서로 다른 영역에 배치하는 entailment hierarchy를 구축하고, entailment loss function을 사용하여 이들 간의 계층적이고 비대칭적인 관계를 모델링합니다. 이를 통해 HySAC(Hyperbolic Safety-Aware CLIP)이라는 모델을 제안하며, 이 모델은 안전하지 않은 콘텐츠를 인식하고 분류할 뿐만 아니라, 안전하지 않은 질의를 안전한 대안으로 리다이렉트하거나 원본 출력을 유지하는 등 유연한 콘텐츠 검색 기능을 제공합니다. 실험 결과, 제안된 방법은 안전 인식 성능을 향상시키고, 비전-언어 모델의 콘텐츠 조정을 위한 더욱 적응력 있고 해석 가능한 프레임워크를 구축함을 보여줍니다.

시사점, 한계점

시사점:
기존 unlearning 방식의 한계를 극복하고, 안전한 콘텐츠와 안전하지 않은 콘텐츠를 모두 고려하는 새로운 접근법 제시.
hyperbolic space를 활용하여 안전하지 않은 콘텐츠에 대한 모델의 'awareness'를 향상시킴.
안전하지 않은 콘텐츠 분류 및 유연한 콘텐츠 검색 기능을 동시에 제공하는 다기능 모델 개발.
더욱 적응력 있고 해석 가능한 콘텐츠 조정 프레임워크 제공.
한계점:
hyperbolic space를 활용한 모델링의 복잡성 및 계산 비용 증가 가능성.
실제 세계의 다양한 안전하지 않은 콘텐츠에 대한 일반화 성능에 대한 추가적인 검증 필요.
entailment hierarchy 구축 및 loss function 설계의 최적화에 대한 추가 연구 필요.
👍