Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

EarthSynth: Generación de observaciones informativas de la Tierra con modelos de difusión

Created by
  • Haebom

Autor

Jiancheng Pan, Shiye Lei, Yuqian Fu, Jiahao Li, Yanxing Liu, Yuze Sun, Xiao He, Long Peng, Xiaomeng Huang, Bo Zhao

Describir

EarthSynth es un modelo generativo fundamental basado en la difusión, propuesto para abordar la falta de datos etiquetados, un desafío en la interpretación de imágenes de teledetección. Sintetiza diversos datos satelitales para generar datos etiquetados de observación de la Tierra para tareas posteriores de interpretación de imágenes de teledetección. En concreto, es el primero en intentar la generación multitarea en el campo de la teledetección, superando las limitaciones de generalización de la síntesis orientada a tareas. Entrenado con el conjunto de datos EarthSynth-180K, EarthSynth utiliza una estrategia de entrenamiento composicional contrafactual y un mecanismo de selección de muestras por lotes 3D para mejorar la diversidad de los datos de entrenamiento y fortalecer el control categórico. Además, propone un método basado en reglas llamado R-Filter para filtrar datos sintéticos informativos. Evaluamos EarthSynth en tareas de clasificación de escenas, detección de objetos y segmentación semántica en escenarios de mundo abierto, demostrando mejoras significativas en el rendimiento en tareas de comprensión de vocabulario abierto, lo que proporciona una solución práctica para avanzar en la interpretación de imágenes de teledetección.

Takeaways, Limitations

Takeaways:
Contribuir a la solución del problema de la falta de datos de etiquetado para la interpretación de imágenes de teledetección.
Mejora del rendimiento de la interpretación de imágenes de teledetección mediante la creación de múltiples tareas.
Mejora tu capacidad para comprender vocabulario abierto en escenarios de mundo abierto.
Se presenta su aplicabilidad a diversas tareas de teledetección (clasificación de escenas, detección de objetos, segmentación semántica).
Limitations:
Dependencia del conjunto de datos EarthSynth-180K. La calidad y el tamaño del conjunto de datos pueden afectar el rendimiento.
El enfoque basado en reglas de R-Filter presenta limitaciones para su generalización. Se requiere mayor verificación para validar su aplicabilidad a una gama más amplia de situaciones.
Los resultados presentados podrían limitarse a un conjunto de datos específico. Se requieren experimentos adicionales con diversos conjuntos de datos.
Posible degradación del rendimiento debido a diferencias con los datos del mundo real.
👍