Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

DistJoin: A Decoupled Join Cardinality Estimator based on Adaptive Neural Predicate Modulation

Created by
  • Haebom

作者

Kaixin Zhang, Hongzhi Wang, Ziqi Li, Yabin Lu, Yingze Li, Yu Yan, Yiming Guan

概要

本論文は、学習ベースの集合サイズ推定の現実的な適用を阻害する「集合サイズ推定の三角ジレンマ」(一般性、精度、更新可能性のバランスの問題)を定義し、これを解決するために、複数の自己回帰モデルを使用した効率的な分布予測ベースの結合集合サイズ推定器であるDistJoinを提示します。 DistJoinは、個々のテーブルの確率分布を分離して結合セットのサイズを推定し、高スループット分布推定モデルであるAdaptive Neural Predicate Modulation(ANPM)を開発して効率性を確保します。従来の類似アプローチの分散累積問題を正式な分散分析によって明らかにし,選択性に基づくアプローチによって分散を効果的に低減する。 DistJoinは、equi結合とnon-equi結合の両方をサポートする最初のデータ駆動型の方法であり、高精度、堅牢なデータ更新、一般性、および高速で柔軟な更新と推論速度を示します。実験の結果、DistJoinは従来の方法と比較して最高の精度、堅牢性、一般性を達成し、比較可能な速度を示しました。

Takeaways、Limitations

Takeaways:
Equi結合とnon-equi結合の両方をサポートする最初のデータ駆動方式の提示
従来の方法と比較して高い精度、堅牢性(データ更新のため)、一般性を達成。
迅速かつ柔軟な更新と推論速度を提供します。
既存の類似アプローチの分散累積問題を明らかにし,解決策を提示した。
Limitations:
ANPMモデルの具体的な構造と学習過程の詳細な説明の欠如
実験環境とデータセットに関する詳細情報の欠如。比較対象方法の具体的な説明が不足して再現性を確保することが難しい。
実際の大規模な Production 環境における性能評価の欠如
👍