[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

MS-DGCNN++: Red neuronal de gráficos dinámicos de fusión multiescala con integración de conocimiento biológico para la clasificación de especies de árboles mediante LiDAR

Created by
  • Haebom

Autor

Said Ohamouddou, Abdellatif El Afia, Hanaa El Afia, Raddouane Chiheb

Describir

En este artículo, proponemos una red neuronal convolucional de grafos dinámicos fusionados multiescala jerárquica (MS-DGCNN++) para resolver el problema de la clasificación de especies de árboles a partir de nubes de puntos LiDAR terrestres. La red neuronal convolucional de grafos dinámicos multiescala convencional (MS-DGCNN) tiene una limitación: no puede capturar adecuadamente las relaciones semánticas entre los niveles jerárquicos de una estructura de árbol con procesamiento multiescala paralelo. MS-DGCNN++ resuelve este problema extrayendo características semánticamente significativas a escala local, de rama y de copa, y propagando información a través de ellas. Aplica ingeniería de características específica de la escala en cada escala, como características geométricas estándar a escala local, vectores relativos normalizados a escala de rama e información de distancia a escala de copa. Esto reemplaza el procesamiento paralelo uniforme mediante el uso de representaciones semánticamente diferenciadas que se ajustan a la estructura natural de un árbol. Los resultados experimentales muestran que, con la estrategia de aumento de datos propuesta, se alcanza una precisión del 94,96 % en el conjunto de datos STPCTLS, superando a DGCNN, MS-DGCNN y el modelo de vanguardia PPT, y del 67,25 % en el conjunto de datos FOR-species20K (una mejora del 6,1 % con respecto a MS-DGCNN). También supera a los modelos existentes en los conjuntos de datos ModelNet40 y ModelNet10. En comparación con el método de transformador de vanguardia, presenta menos parámetros y menor complejidad, lo que lo hace adecuado para aplicaciones con recursos limitados.

Takeaways, Limitations

Takeaways:
Demostramos que la fusión jerárquica de múltiples escalas puede aprender eficazmente relaciones semánticas en estructuras de árboles.
Logre mejoras en el rendimiento a través de ingeniería de funciones específicas de cada escala.
Consiga una mayor precisión que los modelos existentes al tiempo que reduce el número de parámetros y la complejidad.
Es un método de propósito general que se puede aplicar no sólo a la clasificación de especies sino también al reconocimiento general de objetos 3D.
La reproducibilidad y extensibilidad están garantizadas mediante la divulgación del código fuente.
Limitations:
Las evaluaciones de desempeño en conjuntos de datos específicos son predominantes, lo que requiere una validación adicional de generalización.
Se necesita más investigación para determinar la generalidad de la estrategia de aumento de datos propuesta.
Falta de evaluación del rendimiento en varios datos de sensores LiDAR.
👍