Sign In

SemViQA: A Semantic Question Answering System for Vietnamese Information Fact-Checking

Created by
  • Haebom
Category
Empty

저자

Nam V. Nguyen, Dien X. Tran, Thanh T. Tran, Anh T. Hoang, Tai V. Duong, Di T. Le, Phuc-Lu Le

개요

본 논문은 GPT, Gemini와 같은 대규모 언어 모델(LLM)로 인해 심화되는 베트남어와 같은 저자원 언어의 잘못된 정보 문제 해결을 위해 새로운 베트남어 사실 확인 프레임워크인 SemViQA를 제시합니다. SemViQA는 의미 기반 증거 검색(SER)과 두 단계 판정 분류(TVC)를 통합하여 정확성과 속도의 균형을 맞추고, ISE-DSC01 데이터셋에서 78.97%의 정확도, ViWikiFC 데이터셋에서 80.82%의 정확도를 달성하여 UIT Data Science Challenge에서 1위를 차지했습니다. 더 빠른 추론 속도를 위해 SemViQA Faster를 개발하여 속도를 7배 향상시키면서 경쟁력 있는 정확도를 유지했습니다. 소스 코드는 깃허브에서 공개됩니다.

시사점, 한계점

시사점:
베트남어 사실 확인 분야의 새로운 state-of-the-art 성능 달성.
의미 기반 증거 검색(SER)과 두 단계 판정 분류(TVC)의 효과적인 통합.
속도와 정확성의 균형을 이룬 SemViQA 및 SemViQA Faster 제시.
저자원 언어의 잘못된 정보 문제 해결에 기여.
오픈소스 공개를 통한 연구의 재현성 및 확장성 제고.
한계점:
논문에서 구체적인 한계점이나 향후 연구 방향에 대한 언급이 부족함.
다른 저자원 언어로의 확장 가능성에 대한 논의 부재.
데이터셋의 편향성이나 일반화 성능에 대한 분석 부족.
👍