Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Recovering Event Probabilities from Large Language Model Embeddings via Axiomatic Constraints

Created by
  • Haebom

저자

Jian-Qiao Zhu, Haijiang Yan, Thomas L. Griffiths

개요

본 논문은 대규모 언어 모델(LLM)이 생성하는 사건 확률의 비일관성 문제를 해결하기 위해 확장된 변분 오토인코더(VAE)를 이용하여 LLM 임베딩에 확률 이론의 공리적 제약 조건을 적용하는 방법을 제안합니다. VAE는 원래 임베딩을 재구성하고 의미적으로 관련된 사건의 임베딩을 예측하는 과정에서 잠재 공간에 사건 확률을 자연스럽게 생성합니다. 특히 상보적 사건(사건 A와 그 여사건 not-A)에 대한 실험을 통해 제안된 방법이 LLM이 직접 보고하는 확률보다 더 일관성 있는 확률을 생성하고 실제 확률과 잘 일치함을 보여줍니다.

시사점, 한계점

시사점: LLM 임베딩에서 일관성 있는 사건 확률을 추출하는 새로운 방법을 제시하여 불확실성이 포함된 사건에 대한 더 정확한 확률 추정을 가능하게 합니다. 오픈 가중치 언어 모델에서 효과가 입증되었습니다.
한계점: 현재는 상보적 사건에 대한 실험 결과만 제시되었으며, 더 복잡한 사건 관계에 대한 일반화 가능성은 추가 연구가 필요합니다. 사용된 VAE 모델의 구조 및 하이퍼파라미터 최적화에 대한 자세한 설명이 부족합니다. 다양한 종류의 LLM에 대한 실험 결과가 제한적입니다.
👍