Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Efficient Fairness Testing in Large Language Models: Prioritizing Metamorphic Relations for Bias Detection

Created by
  • Haebom

저자

Suavis Giramata, Madhusudan Srinivasan, Venkat Naidu Gudivada, Upulee Kanewala

개요

본 논문은 대규모 언어 모델(LLM)의 공정성 문제를 효율적으로 탐지하기 위해 변형 테스트에서 변형 관계(MR)의 우선순위 지정 전략을 탐구합니다. LLM의 가능한 테스트 케이스가 기하급수적으로 증가하기 때문에, 모든 케이스를 테스트하는 것은 불가능하며, 따라서 공정성 위반을 탐지하는 데 효과적인 MR을 우선순위로 지정하는 것이 중요합니다. 본 논문에서는 문장 다양성 기반 접근 방식을 적용하여 MR을 계산하고 순위를 매겨 결함 탐지 성능을 최적화합니다. 실험 결과, 제안된 우선순위 지정 방식은 무작위 우선순위 지정 방식에 비해 결함 탐지율을 22% 향상시키고, 거리 기반 우선순위 지정 방식에 비해 12% 향상시키는 동시에, 첫 번째 결함 발생 시간을 각각 15%, 8% 단축시킵니다. 또한, 결함 기반 우선순위 지정 방식과의 효율성 면에서 5% 이내의 성능을 보이면서도, 결함 라벨링과 관련된 계산 비용을 상당히 줄입니다. 이는 다양성 기반 MR 우선순위 지정이 LLM의 공정성 테스트 향상에 효과적임을 입증합니다.

시사점, 한계점

시사점:
문장 다양성 기반 MR 우선순위 지정 방식이 LLM의 공정성 테스트 효율을 크게 향상시킴을 보여줌.
무작위 및 거리 기반 방식보다 결함 탐지율과 첫 결함 발생 시간 단축에 효과적임.
결함 기반 방식과 유사한 성능을 보이면서 계산 비용을 크게 절감.
LLM의 공정성 평가 및 테스트 방법론 개선에 기여.
한계점:
제안된 방식의 효과는 특정 데이터셋과 LLM에 대한 실험 결과에 기반하며, 다른 환경에서의 일반화 가능성에 대한 추가 연구 필요.
문장 다양성 이외 다른 요소(예: 문맥, 의미)를 고려한 MR 우선순위 지정 전략에 대한 추가 연구 필요.
실제 LLM 배포 환경에서의 적용 가능성 및 실용성에 대한 추가 연구 필요.
👍