Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Modelos de base versus modelos específicos de dominio: comparación de rendimiento, fusión y explicabilidad en el reconocimiento facial

Created by
  • Haebom

Autor

Redwan Sony, Parisa Farmanifard, Arun Ross, Anil K. Jain

Describir

Este artículo compara y analiza el rendimiento de los modelos base generales (p. ej., CLIP, BLIP, GPT-4o, Grok-4) y los modelos especializados (p. ej., AdaFace, ArcFace) en el reconocimiento facial. Experimentos con múltiples modelos base y conjuntos de datos de referencia demuestran que los modelos especializados superan al modelo base de disparo cero, y que este último mejora las imágenes faciales sobresegmentadas. Además, la fusión a nivel de puntuación de los modelos base y especializados mejora la precisión con bajos índices de error. Asimismo, modelos base como GPT-4o y Grok-4 facilitan la explicación del proceso de reconocimiento facial y ayudan a abordar la toma de decisiones con baja confianza en AdaFace. En conclusión, destacamos la importancia de combinar adecuadamente los modelos especializados y base.

Takeaways, Limitations

Takeaways:
Demostramos que el modelo de reconocimiento facial especializado supera al modelo de referencia de cero disparos.
Sugiriendo la importancia de la información contextual en imágenes sobresegmentadas.
Sugerir la posibilidad de mejora del rendimiento a través de la fusión de niveles de puntuación de modelos básicos y especializados.
Sugerir la posibilidad de asegurar la explicabilidad y mejorar la confiabilidad de los procesos de reconocimiento facial utilizando modelos básicos.
Limitations:
Resultados experimentales limitados a modelos y conjuntos de datos básicos y especializados específicos.
Se necesita más investigación sobre otros métodos de fusión además de la fusión a nivel de puntuación.
Falta de una evaluación sólida de diversas características faciales (por ejemplo, expresión, iluminación).
Falta de evaluación cuantitativa del potencial explicativo del modelo subyacente.
👍