Sign In

Dialogue Ontology Relation Extraction via Constrained Chain-of-Thought Decoding

Created by
  • Haebom
Category
Empty

저자

Renato Vukovic, David Arps, Carel van Niekerk, Benjamin Matthias Ruppik, Hsien-Chin Lin, Michael Heck, Milica Ga\v{s}ic

개요

본 논문은 작업 지향 대화 시스템에서 사용되는 온톨로지 자동 생성에 초점을 맞추고 있습니다. 기존 시스템은 수동으로 온톨로지를 구축해야 하는 한계를 가지는데, 본 연구는 대규모 언어 모델을 활용하여 관계 추출 과정을 자동화하는 방법을 제시합니다. 특히, 추론 문제 해결에 효과적인 Chain-of-Thought (CoT) 디코딩 기법을 관계 추출에 적용하여, 다양한 디코딩 경로를 생성하고 신뢰도 기반으로 관계를 선택하는 방식을 제안합니다. 온톨로지 용어 및 관계로 디코딩을 제한하여 환각(hallucination) 문제를 줄이는 것을 목표로 합니다. 두 개의 데이터셋을 이용한 실험 결과, 소스 미세 조정 및 원샷 프롬프트 방식의 대규모 언어 모델에서 성능 향상을 확인했습니다.

시사점, 한계점

시사점:
대규모 언어 모델과 CoT 디코딩을 활용하여 작업 지향 대화 시스템의 온톨로지 자동 생성을 위한 효율적인 관계 추출 방법을 제시.
다중 디코딩 경로 생성 및 신뢰도 기반 선택을 통해 관계 추출의 정확도 향상.
온톨로지 용어 및 관계 제한을 통한 환각 문제 감소.
소스 미세 조정 및 원샷 프롬프트 방식의 대규모 언어 모델에서 성능 향상 확인.
한계점:
제안된 방법의 성능 향상이 특정 데이터셋에 국한될 가능성.
다양한 유형의 작업 지향 대화 데이터에 대한 일반화 성능 평가 필요.
CoT 디코딩의 계산 비용 증가 문제.
복잡한 온톨로지 구조에 대한 적용성 검증 필요.
👍