Feeds

ParaFuzz: 해석 가능성을 기반으로 한 NLP에서의 오염 샘플 탐지 기법

Summary

이 논문에서는 ParaFuzz라는 새로운 기법을 제안합니다. 이 기법은 자연어 처리(NLP)에서 오염된 샘플을 탐지하는 데 중점을 두고 있습니다. 해석 가능성을 강조하여, 모델의 결정 과정을 이해하고 개선할 수 있는 방법을 제공합니다. 이를 통해 NLP 시스템의 신뢰성을 높이고, 데이터 품질을 보장하려는 노력을 담고 있습니다.

Content

ParaFuzz: An Interpretability-Driven Technique for Detecting Poisoned Samples in NLP - https://arxiv.org/pdf/2308.02122.pdf