[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

SEMT: Arquitectura de red de transformadores de malla de expansión estática para subtítulos de imágenes de teledetección

Created by
  • Haebom

Autor

Khang Truong, Lam Pham, Hieu Tang, Jasmin Lampert, Martin Boyer, Son Phan, Truong Nguyen

Describir

En este artículo, presentamos una arquitectura de red basada en transformadores para el subtitulado de imágenes de teledetección (RSIC). Evaluamos e integramos diversas técnicas, como la expansión estática, la autoatención aumentada con memoria y el transformador de malla, y evaluamos el modelo utilizando dos conjuntos de datos de imágenes de teledetección: UCM-Caption y NWPU-Caption. El modelo propuesto, con el mejor rendimiento, supera a los sistemas más avanzados en la mayoría de las métricas de evaluación, lo que demuestra su potencial de aplicación en sistemas reales de imágenes de teledetección.

Takeaways, Limitations

Takeaways:
Se presenta una arquitectura eficaz basada en transformadores para la generación de títulos de imágenes de teledetección.
Mejora del rendimiento mediante la integración de diversas técnicas.
Demostración de la aplicabilidad de sistemas de teledetección en el mundo real.
Logrando un rendimiento de vanguardia.
Limitations:
Limitaciones en el tipo y tamaño del conjunto de datos utilizado.
Falta de análisis en profundidad de la efectividad de técnicas específicas.
Se necesita una validación adicional para aplicaciones de sistemas del mundo real.
👍