Sign In

BERT-based model for Vietnamese Fact Verification Dataset

Created by
  • Haebom
Category
Empty

저자

Bao Tran, T. N. Khanh, Khang Nguyen Tuong, Thien Dang, Quang Nguyen, Nguyen T. Thinh, Vo T. Hung

개요

베트남어 데이터셋을 사용한 사실 검증(Fact Verification)을 위한 새로운 접근법을 제시하는 논문입니다. 정보 접근의 용이성 증대와 함께 정보 정확성 검증의 중요성이 커짐에 따라, 문장 선택 및 분류 모듈을 통합한 통합 네트워크 아키텍처를 제안합니다. PhoBERT와 XLM-RoBERTa 사전 훈련된 대규모 언어 모델을 활용하여 베트남어 데이터셋 ISE-DSC01로 모델을 학습시켰으며, 기준 모델 대비 모든 세 가지 평가 지표에서 우수한 성능을 보였습니다. 특히, Strict Accuracy는 75.11%를 달성하여 기준 모델 대비 28.83% 향상되었습니다.

시사점, 한계점

시사점:
베트남어 사실 검증 분야에서 기존 모델보다 성능이 향상된 새로운 모델을 제시.
대규모 언어 모델을 활용하여 베트남어 사실 검증의 정확도를 높일 수 있음을 입증.
문장 선택 및 분류 모듈 통합을 통한 효율적인 사실 검증 시스템 구축 가능성 제시.
한계점:
사용된 데이터셋 ISE-DSC01에 대한 자세한 설명 부족.
다른 베트남어 사실 검증 모델과의 비교 분석이 부족.
모델의 일반화 성능 및 확장성에 대한 추가 연구 필요.
실제 응용 환경에서의 성능 평가 부족.
👍