Daily Arxiv

This page organizes papers related to artificial intelligence published around the world.
This page is summarized using Google Gemini and is operated on a non-profit basis.
The copyright of the paper belongs to the author and the relevant institution. When sharing, simply cite the source.

Data Valuation by Fusing Global and Local Statistical Information

Created by
  • Haebom
Category
Empty

저자

Xiaoling Zhou, Ou Wu, Michael K. Ng, Hao Jiang

개요

본 논문은 머신러닝 데이터 가치 평가에서 데이터 가치 분포의 중요성을 강조하고, 이를 활용하여 Shapley value 기반 데이터 가치 평가 방법의 성능을 향상시키는 새로운 접근 방식을 제시한다. 구체적으로, 데이터 가치 분포의 전역적, 지역적 통계적 특성을 분석하고, 이를 활용한 정규화 항을 Shapley value 추정에 통합한다. 또한, Shapley value를 재계산하지 않고도 동적 데이터 가치 평가를 수행하는 새로운 방법을 제안한다. 다양한 실험을 통해 제안된 방법론의 효과성과 효율성을 입증한다.

시사점, 한계점

시사점:
데이터 가치 평가에서 데이터 가치 분포의 중요성을 강조하고, 이를 활용한 새로운 방법론을 제시했다.
Shapley value 기반 데이터 가치 평가의 정확성과 효율성을 향상시켰다.
동적 데이터 환경에서 데이터 가치 평가를 효율적으로 수행할 수 있는 방법을 제시했다.
다양한 실험을 통해 제안된 방법론의 유효성을 입증했다.
한계점:
구체적인 정규화 항의 구성 및 구현에 대한 자세한 정보가 부족할 수 있다.
제안된 방법론의 일반화 가능성에 대한 추가적인 연구가 필요할 수 있다.
특정 데이터셋 및 task에 대한 성능 편향이 존재할 수 있다.
👍