本論文は,リアルタイム映像データと海道情報を融合して海上時計を改善する新しい方法を提示した。システムは、ブイのような航海支援装置を検知して、海洋データの対応する表現と正確に一致させることによって、リアルタイム映像フィードに海道データを重ね合わせる。強力な関連性を確保するために、ブイクエリーのバウンディングボックスと信頼性スコアを予測するトランスフォーマベースのエンドツーエンドニューラルネットワークを導入し、イメージ領域の検出を世界座標系の海道マーカーと直接一致させます。提案された方法は、カメラ投影を介してブイ位置を推定する光線追跡モデルと、距離推定モジュールが拡張されたYOLOv7ベースのネットワークを含む基準方法と比較されます。実際の海上シーンデータセットの実験結果は、提案された方法が動的で困難な環境でのオブジェクトの位置決めと関連付け精度を大幅に向上させることを示しています。