Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

PromptGuard at BLP-2025 Task 1: A Few-Shot Classification Framework Using Majority Voting and Keyword Similarity for Bengali Hate Speech Detection

Created by
  • Haebom
Category
Empty

저자

Rakib Hossan, Shubhashis Roy Dipta

개요

BLP-2025 Task 1A 벵골어 혐오 발언을 6개 범주로 분류해야 함. 저자들은 저자원은 언어에 대한 광범위한 레이블 데이터가 필요한 전통적인 지도 학습 방식의 대안으로, 키워드 추출을 위한 카이제곱 통계 분석과 의사 결정을 위한 적응형 다수결 투표를 결합한 Few-shot 프레임워크 PromptGuard를 개발함. 통계적 키워드 선택과 무작위 접근 방식, 분류 확장을 위한 적응형 투표 메커니즘을 탐구함. 카이제곱 키워드는 범주 전반에 걸쳐 일관된 개선을 제공하며, 적응형 투표는 분류 라운드를 확장해야 하는 모호한 경우에 도움이 됨. PromptGuard는 마이크로 F1 67.61을 달성하여 n-gram 기반 (60.75) 및 무작위 접근 방식 (14.65)을 능가함.

시사점, 한계점

카이제곱 기반 키워드 선택은 모든 범주에서 일관된 성능 향상을 보임.
적응형 투표 메커니즘은 모호한 경우에 유용함.
PromptGuard는 n-gram 기반 및 무작위 접근 방식보다 높은 성능을 보임.
Few-shot 학습 환경에서 효과적인 혐오 발언 분류 프레임워크를 제시함.
(한계점은 논문에 명시되지 않음)
👍