Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

REMOTE: A Unified Multimodal Relation Extraction Framework with Multilevel Optimal Transport and Mixture-of-Experts

Created by
  • Haebom

저자

Xinkui Lin, Yongxiu Xu, Minghao Tang, Shilong Zhang, Hongbo Xu, Hao Xu, Yubin Wang

개요

본 논문은 다중 모달 관계 추출(MRE)을 위한 새로운 통합 프레임워크인 REMOTE를 제안합니다. REMOTE는 다층 최적 전달(multilevel optimal transport)과 전문가 혼합(mixture-of-experts)을 활용하여 텍스트 엔티티와 시각적 객체 간의 모달 내 및 모달 간 관계를 동시에 추출합니다. 기존 방법들의 한계점인 단일 관계 추출 및 계산 중복을 극복하고, 전문가 혼합 메커니즘을 통해 다양한 관계 삼중항에 대한 최적의 상호 작용 특징을 동적으로 선택합니다. 또한, 다층 최적 전달 융합 모듈을 도입하여 저수준 정보 손실 없이 다층 인코딩의 장점을 유지하며, 더욱 표현력 있는 표현을 생성합니다. UMRE라는 새로운 데이터셋을 구축하여 REMOTE의 효과성을 평가하였으며, 기존 MRE 데이터셋에서 최첨단 성능을 달성했습니다. 소스 코드는 깃허브에 공개되었습니다.

시사점, 한계점

시사점:
다양한 유형의 관계 삼중항을 동시에 추출하는 통합 프레임워크 제시
다층 최적 전달 및 전문가 혼합 메커니즘을 통해 효율적이고 표현력 있는 관계 추출
UMRE 데이터셋 구축을 통한 객관적인 성능 평가 및 비교
최첨단 성능 달성 및 오픈소스 공개를 통한 연구 활성화
한계점:
UMRE 데이터셋의 규모 및 다양성이 향후 개선될 여지가 있음.
특정 유형의 관계에 대해서는 성능 차이가 발생할 가능성 존재.
다층 최적 전달 모듈의 계산 복잡도가 높을 수 있음.
👍