Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Revelación de la formación de sesgos en redes neuronales profundas a través de los mecanismos geométricos del desacoplamiento visual humano

Created by
  • Haebom

Autor

Yanbiao Ma, Bowei Liu, Boyuan Gao, Wei Dai, Jiayi Chen, Shuo Li, Andi Zhang

Describir

Este artículo aborda el fenómeno de las redes neuronales profundas (DNN) que presentan sesgos hacia ciertas categorías en el reconocimiento de objetos, a pesar de contar con datos de entrenamiento equilibrados. Para dilucidar el mecanismo subyacente de estos sesgos, proponemos un marco de análisis geométrico que vincula la complejidad geométrica de las variedades perceptuales específicas de cada clase en las DNN con los sesgos del modelo, inspirado en la forma en que los sistemas visuales humanos logran el reconocimiento de objetos separando las variedades de objetos mediante el procesamiento jerárquico. Nuestros resultados muestran que las diferencias en la complejidad geométrica pueden generar diferencias en la capacidad de reconocimiento entre categorías, lo que a su vez puede generar sesgos. Para respaldar este análisis, presentamos la biblioteca Perceptual-Manifold-Geometry, diseñada para calcular las propiedades geométricas de las variedades perceptuales.

Takeaways, Limitations

Takeaways: Explica la causa del sesgo de reconocimiento de objetos en las redes neuronales profundas (RND) desde una nueva perspectiva de las diferencias en la complejidad geométrica. Proporciona una herramienta para el análisis de variedades perceptuales y el diagnóstico de sesgos en las RDN mediante la biblioteca Perceptual-Manifold-Geometry. Sugiere la posibilidad de aplicar el mecanismo de procesamiento jerárquico del sistema visual humano para resolver el sesgo en las RDN.
Limitations: Se requiere mayor investigación sobre la generalidad del marco propuesto y su aplicabilidad a diversas arquitecturas de redes neuronales profundas (DNN) y conjuntos de datos. No se considera la influencia de factores distintos a la complejidad geométrica (p. ej., desequilibrio de datos, proceso de entrenamiento, etc.). Se requiere mayor verificación de la escalabilidad y eficiencia de la biblioteca Perceptual-Manifold-Geometry.
👍