Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Combating Confirmation Bias: A Unified Pseudo-Labeling Framework for Entity Alignment

Created by
  • Haebom

저자

Qijie Ding, Jie Yin, Daokun Zhang, Junbin Gao

개요

본 논문은 지식 그래프 간의 엔티티 정렬(Entity Alignment, EA)에서 확인 편향(confirmation bias) 문제를 해결하기 위해 통합적 의사 레이블링 프레임워크(Unified Pseudo-Labeling framework for Entity Alignment, UPL-EA)를 제안합니다. 기존의 의사 레이블링 기반 EA 모델들은 높은 신뢰도로 예측된 비정렬 엔티티 쌍을 반복적으로 추가하여 학습 데이터를 확장하지만, 확인 편향으로 인한 오류가 발생할 수 있습니다. UPL-EA는 최적 수송(Optimal Transport, OT) 기반 의사 레이블링과 병렬 의사 레이블 앙상블(Parallel pseudo-label ensembling)이라는 두 가지 구성 요소로 이루어져 있습니다. OT 기반 의사 레이블링은 이산 OT 모델링을 사용하여 엔티티 대응 관계를 효과적으로 결정하고 잘못된 매칭을 줄이며, 일대일 대응 관계를 만족하는 의사 레이블을 추론합니다. 병렬 의사 레이블 앙상블은 독립적으로 훈련된 여러 모델의 예측을 결합하여 의사 레이블의 정확도를 높입니다. 실험 결과, UPL-EA는 15개의 경쟁 기법보다 우수한 성능을 보이며, 의사 레이블링 기반 EA에 대한 일반적인 프레임워크로서의 유용성을 입증합니다.

시사점, 한계점

시사점:
확인 편향 문제를 효과적으로 해결하는 새로운 의사 레이블링 프레임워크 UPL-EA 제시.
최적 수송(OT)과 병렬 앙상블 기법을 활용하여 의사 레이블링의 정확도 향상.
기존 EA 모델의 성능을 뛰어넘는 실험 결과 제시.
의사 레이블링 기반 EA에 대한 일반적인 프레임워크로 활용 가능성 제시.
한계점:
UPL-EA의 성능 향상이 특정 데이터셋이나 지식 그래프 구조에 의존할 가능성 존재.
OT 기반 의사 레이블링의 계산 복잡도가 높을 수 있음.
다양한 종류의 지식 그래프에 대한 일반화 성능에 대한 추가적인 검증 필요.
👍