Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

OE3DIS : segmentation d'instances de nuages de points 3D ouverts

작성자
  • Haebom

Auteur

Phuc DA Nguyen, Minh Luu, Anh Tran, Cuong Pham, Khoi Nguyen

Contour

Cet article présente le problème de segmentation d'instances 3D à vocabulaire ouvert (OE-3DIS), qui permet une segmentation d'objets innovante sans noms de classe prédéfinis. Les méthodes existantes de segmentation d'instances 3D à vocabulaire ouvert (OV-3DIS) souffrent de la limitation liée à l'utilisation de noms de classe prédéfinis lors des tests ; OE-3DIS pallie cette limitation. Nous construisons un modèle de base robuste en exploitant l'approche OV-3DIS et un modèle de langage multimodal 2D à grande échelle, et évaluons ses performances à l'aide d'un nouveau score Open-Kind et d'un score AP standardisé, qui évaluent la qualité sémantique et géométrique des masques prédits et de leurs noms de classe associés. Sur les jeux de données ScanNet200 et ScanNet++, nous obtenons des performances significatives par rapport au modèle de base, et surpassons même la méthode OV-3DIS de pointe précédente, Open3DIS.

Takeaways, Limitations

Takeaways:
En définissant le problème OE-3DIS, qui permet la segmentation d'instances 3D sans noms de classe prédéfinis, et en présentant un modèle de base puissant et des mesures d'évaluation pour celui-ci, nous contribuons au développement de systèmes de reconnaissance d'objets 3D plus autonomes.
Amélioration des performances de segmentation d'instances 3D à l'aide de modèles de langage multimodaux 2D à grande échelle.
Un nouveau score de type ouvert permet une évaluation complète de la qualité sémantique et géométrique.
Obtenez des performances qui surpassent celles des modèles les plus performants existants.
Limitations:
D’autres expériences sont nécessaires pour évaluer les performances de généralisation de la méthode proposée.
Des évaluations de performances supplémentaires sur divers ensembles de données 3D sont nécessaires.
En raison de la forte dépendance aux modèles linguistiques multimodaux 2D à grande échelle, les limitations des modèles peuvent affecter les performances d'OE-3DIS.
👍