Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo. La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro. Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.
Transformador de máscara transferible: segmentación semántica entre dominios con estimación de transferibilidad adaptativa a regiones
Created by
Haebom
Autor
Jianhua Liu, Zhengyu Li, Yanru Wu, Jingge Wang, Yang Tan, Ruizhe Zhao, Guan Wang, Yang Li
Describir
Este artículo propone una técnica de adaptación a nivel regional para abordar la degradación del rendimiento causada por las diferencias entre dominios en la segmentación semántica mediante Transformadores de Visión (ViTs). Para superar las limitaciones de las técnicas de adaptación globales o a nivel de parche existentes, segmentamos dinámicamente las imágenes en regiones estructural y semánticamente consistentes mediante el Estimador de Transferibilidad Adaptativo Basado en Clústeres (ACTE) y evaluamos la transferibilidad de cada región. Posteriormente, el módulo Atención Enmascarada Transferible (TMA) integra los mapas de transferibilidad específicos de cada región en el mecanismo de atención de los ViTs, priorizando la adaptación en regiones con baja transferibilidad y alta incertidumbre semántica. Una evaluación exhaustiva de 20 pares entre dominios demuestra una mejora promedio del 2% en MIoU con respecto a los métodos existentes.
Takeaways, Limitations
•
Takeaways:
◦
Presentamos un método novedoso para abordar eficazmente la degradación del rendimiento de la segmentación semántica basada en ViTs debido a diferencias entre dominios a través de la adaptación a nivel de dominio.
◦
Analizar eficientemente el potencial de entrega regional a través de los módulos ACTE y TMA y reflejarlo en el proceso de adaptación.
◦
Excelente verificación del rendimiento a través de resultados experimentales para varios pares de dominios cruzados.
◦
Se proporciona código fuente abierto.
•
Limitations:
◦
El módulo ACTE puede resultar computacionalmente costoso.
◦
Las mejoras de rendimiento pueden ser limitadas para ciertas combinaciones de dominios.
◦
Se necesitan experimentos adicionales en diferentes arquitecturas y conjuntos de datos.