Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

fact check AI at SemEval-2025 Task 7: Multilingual and Crosslingual Fact-checked Claim Retrieval

Created by
  • Haebom

저자

Pranshu Rastogi

개요

SemEval-2025 Task 7인 다국어 및 교차 언어 사실 확인 주장 검색을, 문장 유사성에 최적화된 사전 훈련된 트랜스포머에서 미세 조정된 이중 인코더 모델을 사용하여 학습-순위 지정 작업으로 접근했습니다. 다국어 검색에는 원본 언어와 영어 번역본을 모두 사용하고, 교차 언어 검색에는 영어 번역본만 사용하여 훈련했습니다. 5억 개 미만의 매개변수를 가진 경량 모델을 사용하고 Kaggle T4 GPU에서 훈련하여 다국어 검색에서 92% Success@10, 교차 언어 검색에서 80% Success@10를 달성했습니다. 다국어 트랙에서 10위, 교차 언어 트랙에서 5위를 차지했습니다.

시사점, 한계점

시사점: 경량 모델과 제한된 컴퓨팅 자원을 사용하여 다국어 및 교차 언어 사실 확인 주장 검색에서 상당한 성능을 달성할 수 있음을 보여줍니다. Kaggle T4 GPU와 같은 상대적으로 접근성이 높은 환경에서도 효과적인 모델 훈련이 가능함을 시사합니다.
한계점: Success@10 지표만 제시되어 다른 지표(예: MAP, NDCG)에 대한 성능은 알 수 없습니다. 사용된 데이터셋과 모델 구조에 대한 자세한 설명이 부족합니다. 다국어 검색에 원본 언어를 사용했지만, 원본 언어와 영어 번역본 간의 성능 차이 분석이 부족합니다. 상위권(5위, 10위)에 그친 점을 고려할 때, 최고 성능을 달성하기 위한 추가적인 개선 여지가 존재합니다.
👍