Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

OE3DIS: Open-Ended 3D Point Cloud Instance Segmentation

Created by
  • Haebom

作者

Phuc DA Nguyen, Minh Luu, Anh Tran, Cuong Pham, Khoi Nguyen

概要

この論文は、事前に定義されたクラス名なしで新しいオブジェクトを分割できるオープンタイプの3Dインスタンス分割(OE-3DIS)の問題を提示します。従来のオープンな語彙3Dインスタンス分割(OV-3DIS)メソッドは、テスト時に事前定義されたクラス名に依存する制限があり、OE-3DISはこれらの制約を軽減します。 OV-3DISアプローチと2Dマルチモード大規模言語モデルを活用して強力な基準モデルを構築し、予測マスクと関連するクラス名の意味と幾何学的品質を評価する新しいオープンタイプスコアと標準APスコアを使用してパフォーマンスを評価します。 ScanNet200とScanNet ++データセットでは、基準モデルよりもパフォーマンスが大幅に向上し、さらに従来の最高性能のOV-3DIS方式であるOpen3DISよりも優れた性能を示しました。

Takeaways、Limitations

Takeaways:
事前定義されたクラス名なしで3Dインスタンス分割が可能なOE-3DIS問題を定義し、そのための強力な基準モデルと評価指標を提示することにより、より自律的な3Dオブジェクト認識システムの開発に貢献します。
2Dマルチモーダル大規模言語モデルを活用した3Dインスタンス分割パフォーマンスの向上
新しいオープンタイプのスコアを通じて意味論的および幾何学的品質を総合的に評価可能
従来の最高性能モデルを上回る性能達成。
Limitations:
提案された方法の一般化性能に関する追加の実験が必要である。
さまざまな3Dデータセットのパフォーマンス評価がさらに必要です。
2Dマルチモーダル大規模言語モデルへの依存度が高く、モデルの限界がOE-3DIS性能に影響を及ぼす可能性が存在。
👍