Este artículo destaca la importancia de monitorear la dinámica del arbolado urbano para apoyar las políticas de ecologización urbana y reducir los riesgos para la infraestructura energética. Presentamos un estudio sobre la extracción de puntos de árboles utilizando LiDAR multiespectral (MS-LiDAR) y un modelo de aprendizaje profundo (DL). Para superar las limitaciones del LiDAR aéreo convencional debido al complejo entorno urbano y la diversidad arbórea, utilizamos MS-LiDAR, que captura datos espaciales y espectrales en 3D. Evaluamos tres modelos de vanguardia: Superpoint Transformer (SPT), Point Transformer V3 (PTv3) y Point Transformer V1 (PTv1). Los resultados muestran que el modelo SPT alcanza un 85,28% mIoU, demostrando una eficiencia y precisión de tiempo superiores. Además, agregar el índice de vegetación de diferencia pseudonormalizada (pNDVI) a la información espacial arrojó la mayor precisión de detección, reduciendo la tasa de error en 10,61 puntos porcentuales. Este estudio demuestra el potencial de MS-LiDAR y DL para mejorar la extracción e inventario de árboles.