Sign In

A Zero-shot Learning Method Based on Large Language Models for Multi-modal Knowledge Graph Embedding

Created by
  • Haebom
Category
Empty

저자

Bingchen Liu, Jingchen Li, Naixing Xu, Xin Li

개요

본 논문은 대규모 언어 모델(LLM)을 활용하여 다중 모드 지식 그래프(MMKG)의 제로샷 임베딩 학습을 위한 프레임워크인 ZSLLM을 제안합니다. 기존 제로샷 학습(ZL) 방법들이 미지의 범주를 포함하는 새로운 관계나 개체를 정확하게 추론하고 처리하는 데 어려움을 겪는 문제를 해결하기 위해, LLM의 추론 능력을 활용하여 미지의 범주에 대한 텍스트 모드 정보를 프롬프트로 사용합니다. 이를 통해 다양한 모드 간의 의미 정보 전달을 가능하게 하고, 모델 기반 학습을 통해 MMKG에서 미지의 범주에 대한 임베딩 표현을 향상시킵니다. 실제 데이터셋에 대한 실험 결과, 제안된 방법이 최첨단 기법보다 우수함을 보여줍니다.

시사점, 한계점

시사점:
LLM을 활용하여 MMKG의 제로샷 학습 문제를 효과적으로 해결하는 새로운 프레임워크 제시
미지의 범주에 대한 텍스트 정보를 활용하여 모드 간 의미 정보 전달 개선
다양한 실제 데이터셋에서 최첨단 기법 대비 우수한 성능 검증
한계점:
제안된 방법의 확장성 및 일반화 능력에 대한 추가적인 연구 필요
LLM의 성능에 의존적일 수 있음
특정 유형의 MMKG에만 적용 가능할 수 있는 한계 존재 가능성
LLM 사용으로 인한 계산 비용 증가 가능성
👍