Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Hacia una comparación y alineación explicables de las incrustaciones de características

Created by
  • Haebom

Autor

Mohammad Jalali, Bahar Dibaei Nia, Farzan Farnia

Describir

En este artículo, proponemos un nuevo marco, Spectral Pairwise Embedding Comparison (SPEC), para comparar diferentes modelos de incrustación de características. A diferencia de estudios previos que se centran principalmente en comparaciones numéricas basadas en el rendimiento de la clasificación, SPEC analiza la disparidad en la agrupación de grupos de muestra dentro del espacio de incrustación para analizar analíticamente las diferencias entre incrustaciones. Explota matrices kernel derivadas de dos incrustaciones y detecta clústeres de muestra que son capturados de forma diferente por las dos incrustaciones mediante la descomposición propia de la matriz kernel de diferencia. Presentamos una implementación escalable cuya complejidad computacional aumenta linealmente con el tamaño de la muestra e introducimos un problema de optimización para alinear dos incrustaciones de modo que los clústeres identificados en una también se capturen en la otra. Presentamos resultados numéricos que demuestran la aplicación de SPEC para comparar y alinear incrustaciones en conjuntos de datos a gran escala como ImageNet y MS-COCO.

Takeaways, Limitations

Takeaways:
Más allá de las comparaciones de rendimiento numérico tradicionales, proporcionamos un nuevo marco para comparar y comprender analíticamente las diferencias entre las incorporaciones.
Presentamos un algoritmo escalable aplicable a grandes conjuntos de datos.
La alineación de clústeres entre dos incrustaciones puede mejorar la comprensión mutua de los modelos.
Limitations:
El rendimiento del marco propuesto puede depender de las propiedades de agrupamiento del conjunto de datos de referencia.
Cuando se aplica a datos de alta dimensión, la complejidad computacional aún puede ser alta.
Se necesita más investigación sobre el rendimiento de generalización para diferentes tipos de modelos de integración.
👍