Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

EquiTabPFN: Redes ajustadas a priori equivalentes de permutación de objetivos

Created by
  • Haebom

Autor

Michael Arbel, David Salinas, Frank Hutter

Describir

Este artículo destaca el problema de que los modelos de referencia existentes para datos tabulares (p. ej., TabPFN) aprovechan el aprendizaje contextual para adaptarse a nuevas tareas, pero están limitados a un número fijo de dimensiones objetivo predefinidas, lo que requiere costosas estrategias de conjunto. Esta limitación se debe a la falta de equivarianza objetivo, lo que genera predicciones diferentes al cambiar el orden de las dimensiones objetivo. En este artículo, diseñamos una arquitectura completa de equivarianza objetivo para eliminar esta "brecha de equivarianza". Esta arquitectura garantiza la invariancia de permutación mediante un codificador, un decodificador y un mecanismo de atención bidireccional de equivarianza. Las evaluaciones experimentales en puntos de referencia de clasificación estándar muestran que su rendimiento es igual o superior al de los métodos existentes en conjuntos de datos con más clases que las observadas durante el preentrenamiento, con una menor sobrecarga computacional.

Takeaways, Limitations

Takeaways:
Revelamos las limitaciones de los modelos de datos tabulares existentes que carecen de transformabilidad de equivalencia de objetivos.
Mejore la estabilidad de la predicción y reduzca la sobrecarga computacional a través de una arquitectura de transformación equivalente al objetivo.
Logra un rendimiento superior o equivalente a los métodos existentes en conjuntos de datos con diversas clases.
Limitations:
Se necesita más investigación sobre la generalidad de la arquitectura presentada y su aplicabilidad a otros tipos de datos.
Se necesita una descripción detallada del tipo y tamaño del conjunto de datos de referencia utilizado.
Falta de evaluación del rendimiento para conjuntos de datos extremadamente grandes o tareas complejas.
👍