Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Prompting is not Enough: Exploring Knowledge Integration and Controllable Generation on Large Language Models

Created by
  • Haebom

저자

Tingjia Shen, Hao Wang, Chuan Qin, Ruijun Sun, Yang Song, Defu Lian, Hengshu Zhu, Enhong Chen

개요

본 논문은 대규모 언어 모델(LLM)을 활용한 개방형 질문 응답(OpenQA) 성능 향상을 목표로 하는 GenKI 프레임워크를 제안합니다. GenKI는 지식 통합과 제어 가능한 생성을 동시에 탐구하여, LLM 기반 OpenQA 방법의 두 가지 주요 과제인 효과적인 지식 통합 및 다양한 작업 상황에 맞는 특정 답변 형식의 적응적 생성을 해결합니다. 이를 위해, 연관된 지식을 검색하고, 검색된 지식을 미세 조정하는 지식 통합 모델을 도입하며, 일관성, 유창성, 답변 형식 보장을 기반으로 하는 앙상블을 통해 제어 가능한 생성을 가능하게 합니다. TriviaQA, MSMARCO, CMRC2018 데이터셋에 대한 실험 결과는 GenKI가 최첨단 기준선과 비교하여 효과적임을 보여주며, 지식 검색 빈도와 모델의 정확한 지식 회수 능력 간의 선형 관계를 밝혀냈습니다.

시사점, 한계점

시사점:
LLM 기반 OpenQA에서 지식 통합과 제어 가능한 생성을 동시에 개선하는 새로운 프레임워크 제시
다양한 데이터셋(TriviaQA, MSMARCO, CMRC2018)에서 SOTA 성능 달성
지식 검색 빈도와 정확한 지식 회수 능력 간의 선형 관계 규명
한계점:
구체적인 한계점 정보는 논문 요약에 명시되지 않음 (추후 논문을 자세히 읽어봐야 함)
👍