Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Ustnlp16 at SemEval-2025 Task 9: Improving Model Performance through Imbalance Handling and Focal Loss

Created by
  • Haebom
Category
Empty

저자

Zhuoang Cai, Zhenghao Li, Yang Liu, Liyuan Guo, Yangqiu Song

개요

본 논문은 SemEval-2025 Task 9: Food Hazard Detection을 위한 시스템을 제시합니다. 식품 위험 감지 분류 작업은 심각한 클래스 불균형, 짧고 비정형적인 텍스트, 중복되는 의미 범주로 인해 데이터 불균형 문제를 겪습니다. 본 논문에서는 데이터 증강 기법을 적용하여 분류 성능을 향상시키는 방법을 제시합니다. BERT와 RoBERTa 기반의 Transformer 모델을 사용하고, 랜덤 오버샘플링, Easy Data Augmentation (EDA), focal loss 등 다양한 데이터 균형 전략을 탐색합니다. 실험 결과, EDA가 클래스 불균형을 효과적으로 완화하여 정확도와 F1 점수를 크게 향상시키는 것을 보여줍니다. 또한, focal loss를 오버샘플링과 EDA와 결합하면 특히 분류하기 어려운 예시에 대해 모델의 강건성이 더욱 향상됩니다.

시사점, 한계점

시사점:
데이터 증강 기법(EDA)을 활용하여 식품 위험 감지 분류 작업에서 클래스 불균형 문제를 효과적으로 해결할 수 있음을 보여줌.
Focal loss와 오버샘플링을 EDA와 결합하여 모델의 성능 및 강건성을 향상시킬 수 있음을 제시.
Transformer 기반 모델(BERT, RoBERTa)을 활용하여 식품 위험 감지 분류 작업에 효과적인 성능을 달성.
한계점:
본 논문에서 제시된 데이터 증강 기법 및 데이터 균형 전략의 일반화 가능성에 대한 추가적인 연구 필요.
다양한 유형의 식품 위험 데이터에 대한 실험 및 분석이 추가적으로 필요.
다른 데이터 증강 기법이나 클래스 불균형 해결 방법과의 비교 분석이 부족.
👍