Efficiently Sampling Interval Patterns from Numerical Databases
Created by
Haebom
Category
Empty
저자
Djawad Bekkoucha, Lamine Diop, Abdelkader Ouali, Bruno Cremilleux, Patrice Boizumault
개요
본 논문은 대규모 데이터베이스에서 정보 발견을 위한 유망한 접근 방식인 패턴 샘플링에 대해 다루며, 특히 수치형 데이터베이스 내 간격 패턴을 처리하기 위한 새로운 샘플링 방법론을 제시한다. Fips는 간격 패턴을 빈도에 비례하여 샘플링하며, HFips는 빈도와 하이퍼 볼륨의 곱에 비례하여 샘플링한다. 이 방법들은 패턴 샘플링에서 흔히 발생하는 롱테일 현상을 효과적으로 처리하도록 설계되었으며, 이론적 분석과 실험을 통해 성능을 입증한다.